leshchenko1979 / fast_bitrix24

Высокопроизводительный API wrapper для Питона для быстрого массового обмена данными с Битрикс24 через REST API

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

fast_bitrix24

API wrapper для Питона для быстрого получения данных от Битрикс24 через REST API.

Статистика загрузок Статистика тестов codecov Sourcery CodeFactor

Основная функциональность

Высокая скорость обмена данными

Тест скорости

  • На больших списках скорость обмена данными с сервером достигает тысяч элементов в секунду.
  • Автоматическая упаковка запросов в батчи сокращает количество требуемых запросов к серверу и ускоряет обмен данными.
  • Батчи отправляются на сервер не последовательно, а параллельно.
  • Продвинутые стратегии работы с постраничным доступом ускоряют выгрузку на порядки (см. результаты тестов).

Избежание отказов сервера

  • Соблюдаются все политики Битрикса по ограничению скорости запросов
  • Автоматический autothrottling - если сервер возвращает ошибки, скорость автоматически понижается.
  • Если сервер для сложных запросов начинает возвращать ошибки, можно в одну строку понизить скорость запроосов.

Удобство кода

  • Высокоуровневые списочные методы для сокращения количества необходимого кода. Большинство операций занимают только одну строку кода. Обработка параллельных запросов, упаковка запросов в батчи и многое другое убрано "под капот".
  • Позволяет задавать параметры запроса именно в таком виде, как они приведены в документации к Bitrix24 REST API. Параметры проверяются на корректность для облегчения отладки.
  • Выполнение запросов автоматически сопровождается прогресс-баром из пакета tqdm, иллюстрирующим не только количество обработанных элементов, но и прошедшее и оставшееся время выполнения запроса.
  • OAuth-авторизация: при работе с приложениями отслеживает устаревание токена авторизации и автоматически обновляет его через вызов функции, передаваемой пользователем.

Синхронный и асинхронный клиенты

  • Наличие асинхронного клиента позволяет использовать библиотеку для написания веб-приложений (например, телеграм-ботов).

Нас используют

Начало работы

Установите модуль через pip:

pip install fast-bitrix24

Далее в python:

from fast_bitrix24 import Bitrix

# замените на ваш вебхук для доступа к Bitrix24
webhook = "https://your_domain.bitrix24.ru/rest/1/your_code/"
bx = Bitrix(webhook)

Методы полученного объекта bx в дальнейшем используются для взаимодействия с сервером Битрикс24.

Примеры использования

get_all()

Чтобы получить полностью список сущностей, используйте метод get_all():

# список лидов
leads = bx.get_all('crm.lead.list')

Метод get_all() возвращает список, где каждый элемент списка является словарем, описывающим одну сущность из запрошенного списка.

Вы также можете использовать параметр params, чтобы кастомизировать запрос:

# список сделок в работе, включая пользовательские поля
deals = bx.get_all(
    'crm.deal.list',
    params={
        'select': ['*', 'UF_*'],
        'filter': {'CLOSED': 'N'}
})

get_by_ID()

Если у вас есть список ID сущностей, то вы можете получить их свойства при помощи метода get_by_ID() и использовании методов вида *.get:

'''
получим список всех контактов, привязанных к сделкам, в виде
{
    ID_сделки_1: [контакт_1, контакт_2, ...],
    ID_сделки_2: [контакт_1, контакт_2, ...],
    ...
}
'''

contacts = bx.get_by_ID(
    'crm.deal.contact.items.get',
    [d['ID'] for d in deals])

Метод get_by_ID() возвращает словарь с элементами вида ID: result, где result - ответ сервера относительно этого ID.

call()

Чтобы создавать, изменять или удалять список сущностей, используйте метод call():

# вставим в начало названия всех сделок их ID
tasks = [
    {
        'ID': d['ID'],
        'fields': {
            'TITLE': f'{d["ID"]} - {d["TITLE"]}'
        }
    }
    for d in deals
]

bx.call('crm.deal.update', tasks)

Метод call() возвращает список ответов сервера по каждому элементу переданного списка.

call(raw=True)

Вызов call с парамтером raw=True отправляет на сервер переданные ему параметры в оригинальном, необработанном виде (пропуская упаковку в батчи), и возвращает ответ сервера без какой-либо обработки.

Подобный вызов можно использовать в отладочных целях, но кроме того, придется его использовать для отправки запросов, которые:

  • в параметрах имеют None (None применяется для стирания значения полей, а упаковка в батчи мешает передавать None),
  • используют устревшие методы Битрикс24, которые принимают на вход список (см. #157).
# стереть DESCRIPTION в лиде 123
params = {"ID": 123, "fields": {"DESCRIPTION": None}}
bx.call('crm.lead.update', params, raw=True)

# добавить комментарий к задаче
bx.call(
    'task.commentitem.add',
    [123, {"POST_MESSAGE": "Комментарий к задаче"}],
    raw=True
)

call_batch()

Если вы хотите вызвать пакетный метод, используйте call_batch():

results = bx.call_batch ({
    'halt': 0,
    'cmd': {
        'deals': 'crm.deal.list', # берем список сделок
        # и берем список дел по первой из них
        'activities': 'crm.activity.list?filter[ENTITY_TYPE]=3&filter[ENTITY_ID]=$result[deals][0][ID]'
    }
})

Асинхронные вызовы

Если требуется использование бибилиотеки в асинхронном коде (или в ноутбуках), то вместо клиента Bitrix() создавайте клиент класса BitrixAsync():

from fast_bitrix24 import BitrixAsync
bx = BitrixAsync(webhook)

Все методы у него - синхронные аналоги методов из Bitrix(), описанных выше:

leads = await bx.get_all('crm.lead.list')

Авторизация через OAuth

Если требуется авторизация через OAuth, то при инициализации клиента Bitrix() необходимо передать в параметре webhook ссылку на эндпойнт приложения, а в параметре token_func - ссылку на асинхронную функцию, которая будет возвращать токен авторизации:

from fast_bitrix24 import Bitrix
import requests

async def get_new_token() -> str:
    oauth_url = 'https://oauth.bitrix.info/oauth/token/'
    params={
        'grant_type': 'refresh_token',
        'client_id': ...,
        'client_secret': ...,
        'refresh_token': ...
    }
    result = requests.get(oauth_url, timeout=10, params=params)
    return result.json()["access_token"]

bx = Bitrix(webhook=ENDPOINT_ADDRESS, token_func=get_new_token)
...

token_func будет вызываться каждый раз, когда необходимо получить впервые или обновить токен авторизации.

Как работает библиотека

  1. Перед обращением к серверу во всех методах класса Bitrix происходит проверка корректности самых популярных параметров, передаваемых к серверу, и поднимаются исключения TypeError и ValueError при наличии ошибок.
  2. Cоздаются запросы на получение всех элементов из запрошенного списка.
  3. Созданные запросы упаковываются в батчи по 50 запросов в каждом.
  4. Полученные батчи параллельно отправляются на сервер с регулировкой скорости запросов (см. ниже "Как fast_bitrix24 регулирует скорость запросов").
  5. Ответы (содержимое поля result) собираются в единый плоский список и возвращаются пользователю.
    • Поднимаются исключения класса aiohttp.ClientError, если сервер Битрикс вернул HTTP-ошибку, и RuntimeError, если код ответа был 200, но ошибка сдержалась в теле ответа сервера.
    • Происходит сортировка ответов (кроме метода get_all()) - порядок элементов в списке результатов совпадает с порядком соответствующих запросов в списке запросов.

В случае с методом get_all() пункт 2 выше выглядит немного сложнее:

  • get_all() делает первый запрос к серверу Битрикс24 с указанным методом и параметрами.
  • Сервер возвращает первую страницу (50 элементов) и параметр total - общее количество элементов, найденных по запросу.
  • Исходя из полученного общего количества элементов, создаются запросы на каждую из страниц (всего total // 50 - 1 запросов), необходимых для получения всех запрошенных элементов.

В связи с тем, что выполнение get_all() по длинным спискам может занимать долгое время, в течение которого пользователи могут добавлять новые элементы в список, может возникнуть ситуация, когда общее полученное количество элементов может не соответствовать изначальному значению total. В таких случаях будет выдано стандартное питоновское предупреждение (warning).

Как fast_bitrix24 регулирует скорость запросов

Библиотека соблюдает официальные ограничения Битрикс24 по скорости запросов (см. ниже "Официальная политика Битрикс24 по скорости запросов"). Одновременно, она начинает снижать скорость запросов, если сервер начинает возвращать ошибки (autothrottling). Подобный подход позволяет на порядки увеличить скорость получения данных (см. тесты скорости).

Официальная политика Битрикс24 по скорости запросов

Одновременно работает два ограничения:

  1. Ограничение по методу Leaky Bucket: https://dev.1c-bitrix.ru/learning/course/index.php?COURSE_ID=93&LESSON_ID=7885
  2. Ограничение по методу Sliding Window в разрезе каждого метода: https://helpdesk.bitrix24.ru/open/15959788

Оба эти ограничения соблюдаются библиотекой.

Советы и подсказки

А умеет ли ваша библиотека ...?

Посмотрите в справочник по API. Если не нашли ответа, свяжитесь с автором.

А как мне сформировать запрос к Битриксу, чтобы ...?

  1. Поищите в официальной документации по REST API.
  2. Если на ваш вопрос там нет ответа - попробуйте задать его в группе "Партнерский REST API" в Сообществе разработчиков Битрикс24.
  3. Спросите в Телеграме в группе разработчиков Битрикс24.
  4. Спросите в Телеграме в группе пользователей fast_bitrix24.
  5. Спросите на русском StackOverflow.

А как понять, что отправляется на сервер и что он возвращает?

Включите логирование запросов и ответов сервера.

import logging

logging.getLogger('fast_bitrix24').addHandler(logging.StreamHandler())

Я получаю ошибку сервера, когда сильно его нагружаю. Что делать?

Способ 1

Оберните обращения к Битриксу в slow:

with bx.slow():
    results = bx.call('crm.lead.add', tasks)

См. подробнее о slow.

Способ 2

При инициализации клиента поэкспериментируйте со значениями параметров, регулирующих нагрузку на сервер:

bx = Bitrix(
    webhook,
    request_pool_size = 20,  # по умолчанию - 50
    requests_per_second = 1.0,  # по умолчанию - 2.0
    batch_size = 20,  # по умолчанию - 50
    operating_time_limit = 100,  # по умолчанию - 480
)

Я хочу вызвать call() только один раз, а не по списку.

Передавайте параметры запроса методу call(), он может делать как запросы по списку, так и единичный запрос:

method = 'crm.lead.add'
params = {'fields': {'TITLE': 'Чпок'}}
bx.call(method, params)

Результатом будет ответ сервера по этому одному элементу.

Однако, если такие вызовы делаются несколько раз, то более эффективно формировать из них список и вызывать call() единожды по всему списку.

Как сортируются результаты при вызове get_all()?

Пока что никак.

Все обращения к серверу происходят асинхронно и список результатов отсортирован в том порядке, в котором сервер возвращал ответы. Если вам требуется сортировка, то вам нужно делать ее самостоятельно, например:

deals = bx.get_all('crm.deal.list')
deals.sort(key = lambda d: int(d['ID']))

Я использую get_all() для получения всех полей всех элементов списка, но это происходит слишком долго. Как ускорить этот процесс?

Сейчас, кода Битрикс ограничивает скорость запросов к серверу, ключевым методом ускорения остается сокращение количества информации, которую вы загружаете с сервера, и сохранение скорости скачивания в пределах, установленных Битриксом. Это может быть достигнуто за счет кэширования и сокращения количества скачиваемых полей.

Нарушение политики Битриска по скорости запросов влечет за собой штрафы, поэтому мы рекомендуем соблюдать её (параметр respect_velocity_policy=True).

Я получаю ошибку сертификата SSL. Что делать?

Если вы получаете SSLCertVerificationError / CERTIFICATE_VERIFY_FAILED, попробуйте отключить верификацию сертификата SSL:

bx = BitrixAsync(webhook, ssl=False)

Я использую вашу библиотеку из ноутбуков или из Spyder и получаю ошибки. Что делать?

Ваша cреда выполнения самостоятельно управляет примитивами asyncio (см. больше).

Используйте асинхронный клиент. То есть, вместо кода:

from fast_bitrix24 import Bitrix
bx = Bitrix(webhook)
leads = bx.get_all('crm.lead.list')

используйте код:

from fast_bitrix24 import BitrixAsync
bx = BitrixAsync(webhook)
leads = await bx.get_all('crm.lead.list')

У меня Энтерпрайз. Как мне настроить более высокую скорость запросов?

В конструкторе указывайте параметры request_pool_size=250 и requests_per_second=5:

from fast_bitrix24 import Bitrix
bx = Bitrix(webhook, request_pool_size=250, requests_per_second=5)

Как связаться с автором

About

Высокопроизводительный API wrapper для Питона для быстрого массового обмена данными с Битрикс24 через REST API

License:MIT License


Languages

Language:Python 99.9%Language:Jupyter Notebook 0.1%Language:Batchfile 0.0%