MediaWiki - Борьба со спамом

Материал из Кафедра ИУ5 МГТУ им. Н.Э.Баумана, студенческое сообщество
Перейти к навигации Перейти к поиску

Спам

В определённый момент ваша вики наберёт достаточную ежедневную посещаемость, чтобы заинтересовать гениальных SEO'шников, которых захотят воспользоваться возможностями всеобщей правки страниц, индексирующихся поисковиками, для продвижения своих сайтов по продаже холодильников и увеличении длины различных частей тела.

И если с одним-двумя вы ещё будете справляться, поглядывая иногда в свежие правки, то когда они будут валиться по несколько десятков за раз, вам понадобится что-то более автоматизированное.

Где и как спамят

На самом деле, везде:

  • создаются новые страницы с бессмысленными названиями, содержащие стену полусвязного текста с непременными внешними ссылками;
  • в обсуждениях существующих страниц со всё теми же бессмысленными кусками текста;
  • на страницах только что созданных спам-аккаунтов и в их обсуждении.

Кто спамит

Это могут быть как живые спамеры, вносящие правки вручную, так и спам-боты, регистрирующиеся и постящие в автоматическом режиме.

Спам от живых людей может быть осмысленней, чем от ботов - например, текст может быть вполне себе нормальным, и даже ссылка будет смотреться в тему. Но - ничто из запощенного не будет вписываться в тематику вашей вики. Например, предложение выгодно получить кредит без поручителей и SMS.

Отличить спамера в журнале регистрации участников можно по бессмысленному нику, например SsfdsggdsMsdssdwgflk, или с множеством цифр в нике. Но надо учитывать, что это может быть и обычный пользователь, просто с необычным складом ума.

Борьба со спамом

Если вкратце, то полностью от спама вы не защититесь никогда. Всегда может найтись уникальный высокооплачиваемый спамер, который будет вносить аккуратные правки с нужными ему внешними ссылками. Но так как он очень уникальный, его в расчёт не берём.

Самый простой и надёжный способ противодействия спаму - постоянно следить за свежими правками. Так точно никто не проскользнёт. Но, как уже говорилось, так вы сможете справиться только с очень небольшим количеством вредных правок.

Для этого существует ряд расширений MediaWiki, помогающих бороться со спамом гораздо более эффективно. Здесь перечислены использующиеся нами.

Предотвращение спама

SimpleAntiSpam

Очень простое расширение. Добавляет на страницу правки невидимое поле ввода. Если при записи изменений в поле что-то будет, значит правил не человек и правка не проходит. Метод ориентирован на ботов, которые пишут свой треш во все доступные поля ввода.

Загрузить можно здесь.

ConfirmEdit

Конечно же CAPTCHA! Выводится каждый раз, когда в правке присутствует ссылка на внешний ресурс, а также при регистрации нового пользователя.

Загрузить можно здесь.

Удаление спама

Nuke

Чрезвычайно полезное расширение, позволяет разом удалить все 9000 страниц, созданных определённым участником.

Также можно использовать SQL-оператор LIKE - взять и удалить все страницы с названием %увеличить длину%.

Бедняга спамер пыхтел, старался, создавал каждую ручками, а вы удаляете все одним кликом.

Удаление затрагивает только недавние страницы, так что созданные ранее добропорядочными пользователями страницы не пострадают. Временной интервал настраивается через переменную wgRCMaxAge.

Загрузить можно здесь.

CheckUser

Позволяет узнать, под какими IP-адресами заходил пользователь, чтобы затем, сравнивая IP-адреса, найти учётки, созданные с этого же адреса.

Загрузить можно здесь.

User Merge and Delete

Объединение и удаление пользователей. Можно сливать всех спамеров в один заблокированный аккаунт, созданный специально для этого.

Позволяет не захламлять список зарегистрированных участников громоздкими никами ботов и "управлять" их блокировкой "централизованно".

Загрузить можно здесь.