khoben / telemirror

Telegram message forwarder (client API)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Фильтрация дубликатов сообщений

qtozdec opened this issue · comments

Было бы здорово иметь фильтр проверки на оригинальность последних 10-50 сообщений. Очень часто многие каналы пересылают свои посты между собой, в следствие чего происходит их дублирование. У сообщения есть уникальный id, который сохраняется при пересылке?
Если нет, то возможно хотя бы фильтровать текст этих сообщений, по начальным словам.

Сейчас сохраняется только ID сообщений в исходном канале.

Я думаю, если сообщение является репостом (event.message.fwd_from is not None), то надо собирать event.message.fwd_from.from_id и event.message.fwd_from.channel_post и не пропускать следующие репосты с этими же параметрами.
Либо совсем уж крайняя мера -- хранить некоторое количество последних сообщений и сравнивать новые с помощью нечеткого сравнения или сравнением хэшей текста.