Баден-баден: как жить дальше
Весной ввели новый фильтр, который достаточно серьезно повлиял на многих вебмастеров. Прикинем, что делать и как жить дальше.
Скрыть содержание
- Что происходит?
- Что делать?
Исправление попавших под фильтр документов Исправление не попавших под фильтр документов Переезд на HTTPS Переезд на новый домен- Наш рецепт счастья
Что происходит?
На что реагирует Баден
Вначале дайджест фактов, чтобы было на что опираться. Больше всего мне нравятся исследования Алексея Трудова, именно им я доверяю — раз, два, три и вебинар.
Краткие выводы (из моего опыта и рассуждений Алексея):
- Баден реагирует на частое повторение 2-3-словных конструкций в тексте. Особенно это явно видно на страницах, где наспамлено 3-словными пассажами. Само собой, заголовки и сам текст — разные зоны, наспамить в заголовках значительно проще, чем в тексте.
- Баден реагирует на большое количество не несущих смысла «водных» слов в тексте.
- Баден реагирует на бедный язык: как в контексте недостаточного использования терминов по теме, LSI, так и в контексте просто малого числа уникальных слов в тексте. Простым языком — тексты с бедным языком, постоянным повторением одних и тех же слов, малым количеством использованных в тексте уникальных слов — плохие.
У нас новый фильтр отрезал примерно 15% общего трафика и около 10% дохода. Неприятно, но, конечно же, не смертельно.
Как работает Баден?
Баден — подокументный фильтр. Судя по всему, его работа никак не связана с анализом поведенческих факторов и прочим юзер экспириенс.
Увидеть, что документ попал под фильтр — просто. Сравните трафик на документ (или позиции) в марте и в мае, если есть сильное падение — пришел Баден.
Фильтр накладывается на конкретные документы, а не на весь сайт. О так называемом «хостовом» Баден-Бадене чуть ниже.
Хостовые фильтры Яндекса
Чтобы понять дальнейшие рассуждения, чуть-чуть отвлечемся.
Мы уже несколько лет считаем, что все хостовые фильтры Яндекса работают по скоринговой схеме.
Условно, есть хорошие факторы и есть плохие:
- Домену больше 10 лет? +30 баллов.
- Слишком много исходящих ссылок? -50 баллов.
- Жесткая зарекламленность? -30 баллов.
- Большой трафик и отличные ПФ? +100 баллов.
- Быстрая загрузка? +10 баллов.
- Мобильная версия? +3 балла.
Поисковая система в момент очередного апдейта подсчитывает сумму баллов, если сайт упал скажем на -50 — пора понижать его в выдаче.
Самая интересная штука в том, что чтобы вернуться обратно сайт должен не вернуться на -49, а вылезти на +30. Конечно, точные цифры мы не знаем, но факт есть факт: чтобы сайту выйти из-под фильтра недостаточно снять нарушение, приведшее к фильтру (это как раз та самая соломинка, переламывающая горб верблюду). Чтобы выйти из-под фильтра нужно стать значительно лучше по сумме баллов, чем до наложения фильтра.
Конечно же, точные факторы и список очков за каждый мы не знаем. Мы не знаем даже, прямая эта оценка баллов или древовидная (если домену 10 лет, то вот этот фактор будет важнее в 2 раза а вот этот и вот этот в расчет брать не надо). Но весь опыт говорит о работоспособности этой модели.
Попал под фильтр — улучшай все, что только возможно — и тогда фильтр снимут. Если ты точно знаешь из-за чего попал под фильтр и исправил один этот фактор — фильтр скорее всего не снимут.
Хостовый Баден-Баден
Мы считаем, что отдельного фильтра «хостовый Баден-Баден» просто не существует.
В момент введения анализа текстов под этим названием просто появился еще один мощный отрицательный фактор. Если документов, попавших под фильтр много (много относительно общего числа документов на сайте) — это большое количество отрицательных очков для домена в целом.
Если сайт и до этого был говном — то срабатывает обычный скоринговый фильтр, для которого плохие документы под Баденом стали последней каплей.
Выглядит это вот так:
Что делать?
Расскажу кратко о том, что мы пробовали и какие выводы сделали.
Исправление попавших под фильтр документов
Есть сайты, по которым фильтр ударил, но хостовый фильтр так и не пришел — большая часть документов ранжируется без изменений.
Мы попробовали убрать явный переспам в заголовках, существенно проработали все статьи на одном из сайтов.
Эффекта нет. На картинке трафик по проработанному сайту на 300 статей, по которому сильно ударил Баден (статьи выложены в конце 2016):
Итак, просто удаление спамных н-грамм из уже промаркированных фильтром текстов — не работает.
Логика (и опыт наших марафонцев) подсказывает, что конкретные документы из-под фильтра вытащить можно. Но для этого нужно:
- Убрать все спамные конструкции из текста (все лишние повторы).
- Убрать всю воду.
- Удостовериться, что текст реально отвечает на вопросы пользователей.
- Удостовериться, что язык в тексте — нормальный, нет косноязычных конструкций и явного повторения одних и тех же слов. Если есть — заменить на синонимы.
По трудозатратам — для нас сравнимо с написанием новой статьи, поэтому по такому пути мы пока не идем.
Исправление не попавших под фильтр документов
В целом мы считаем, что текущий фильтр — первая волна из длинной череды борьбы с неестественными текстами.
Поэтому, целесообразно защитить свое будущее и исправить хотя бы самые явные ошибки в еще не попавших под фильтр текстах — возможно, это продлит жизнь этих текстов на несколько лет.
Мы написали инструмент для анализа текста, показывающий н-граммы и самые часто употребительные слова. Отличительная черта — наш инструмент палит пассажи даже с разделительными словами в середине.
Выглядит вот так:
Сейчас в проработке словарь и подсветка водных оборотов.
Чтобы вам (и нам) было удобно использовать инструмент, мы написали небольшой плагин для ВП, который добавляет в интерфейс кнопку для быстрой отправки текста на анализ.
Пожалуйста, устанавливайте пользуйтесь! (Не забываем разрешить всплывающие окна после тычка по кнопке)
Внимание! Плагин работает только с PHP7. Повод обновиться для всех!
Буду благодарен за добавление водных словосочетаний в словарь. Отправить словосочетание на модерацию можно по кнопке «Предложить сомнительное слово» под результатами анализа.
Мы решили прогнать через этот инструмент все статьи, опубликованные с начала 2016 до апреля 2017 года (до 2016 мы явно не спамили ключевыми словами в тексте и эти тексты практически не пострадали). Задача контент-менеджера: убрать явный спам, убрать воду и проверить статью на наличие явных ошибок (картинки уехали, тема совсем не раскрыта и тд).
Переезд на HTTPS
Мы подумали, раз исправление документов в нашем случае не работает: может быть попробовать перетащить сайт на новый домен? Сразу же вспомнилось, что в какое-то время Яндекс считал версию с HTTPS отдельным доменом — так может быть просто поменять протокол?
Не сработало. После переезда на HTTPS ни хостовый фильтр не снялся ни подокументный.
Переезд на новый домен
А вот тут похоже бинго!
Мы пока перетащили только один явно спамный сайт на новый домен.
Динамика до фильтра (на картинке видно, что фильтр на этом ГС уже не первый раз):
С одной стороны, до прошлых рекордов очень далеко. С другой стороны, динамика явно положительная и в целом, есть ощущение, что сайт ранжируется сообразно его текущей ценности — все-таки, там откровенный ГС с плохим контентом, который мы НЕ исправляли.
Домен переносился с 301 редиректом.
Наш рецепт счастья
Для сайтов без явного влияния Бадена:
- Скачиваем наш плагин и пробегаем все-все статьи, исправляем явные недочеты.
- Счастливо живем дальше.
Для сайтов с явным влиянием Бадена, но без последствий для всего домена:
- Скачиваем наш плагин, пробегаем все-все статьи, исправляем явные недочеты.
- Переносим сайт на новый домен, если потери велики.
- Счастливо живем дальше.
Update. В марафонском чатике сразу подсказали альтернативное решение. Можно исправить пострадавшие статьи и перенести их на новый URL с 301 редиректом. Фильтр на новые статьи передаться не должен. Спасибо Александру за решение!
Для сайтов с последствиями Бадена для всего домена (это значит, что сайт и до Бадена был говном, просто новый фильтр послужил последней каплей):
- Удаляем или переписываем явно плохие статьи, которые не отвечают ни на какие вопросы пользователей: лучше идти в светлую жизнь без обременения совсем плохим контентом.
- Скачиваем наш плагин, пробегаем все-все статьи, исправляем явные недочеты.
- Устраняем явные косяки (например, зарекламленность или большое количество индексируемого говна в коде, типа заголовков H2 в сайдбаре).
- Переносим сайт на новый домен.
- Счастливо живем дальше.
Если нужно непременно оставить старый домен:
- ОЧЕНЬ глубоко перерабатываем попавшие под фильтр документы. Обращаем внимание на
— переспам н-граммами (особенно в сео-полях и подзаголовках);
— водные обороты;
— использование LSI и богатство языка (заменяем все часто повторяющееся синонимами);
— раскрытие темы, если тема или какой-то интент раскрыт плохо — дописываем (это скажется и на переспаме и на богатстве языка).- Логика подсказывает, что совсем плохие тексты лучше переписать, предварительно расширив семантику и сделав нормальный план статьи.
Для новых сайтов:
Тупо не спамим ключами и следим за тем, чтобы текст давал ценность: решал проблемы людей.
Всем спасибо за внимание! Буду рад вопросам в комментариях =)Добавить комментарий для smart Отменить ответ
Алексей, как обстоят дела с 301-редиректом на новый домен? Методика работает? По сайтам, которые ранее переносились на новый домен, трафик после роста не падал?
Скажем так — хуже точно не стало. Кто-то на новом домене вырос, кто-то остался на том же уровне, что и с фильтром. Внятной репрезентативной статистики у нас нет — так как зафильтровало не многих и мы на них или забили или уже серьезно поработали на новом домене.
Решил полностью переписать отдельные статьи, которые попали под баден.
Алексей подскажите пожалуйста, в этом случае все равно лучше писать статью на новом адресе и делать 301 редирект со старой статьи? Или достаточно просто переписать статью на старом адресе? И как отреагирует гугл в этих случаях? Спасибо.
Я бы сделал на всякий случай новый УРЛ и 301 редирект — с новым адресом в новую жизнь!
Спасибо за статью. А Как узнать какие именно страницы на сайте попали под фильтр? Я понимаю, что это те страницы, которые потеряли трафик в даты запуска фильтра. Но как их определить? Пожалуйста, подскажите куда нажимать : )
ПС: Планируются ли новые статьи на эту тему? Прошло 4 месяца с августа, поделитесь, как у вас результаты?
У меня вот так все навернулось (с 900к трафа в мес до 100к, только Яндекс).
https://prnt.sc/gtj149
Домену 7+ лет, как и сайту. Контента вкачано на миллионы и никогда не было в тз требований по употреблению ключей, но все равно отхватил и почти по всем документам, особенно самым топовым ВЧ где висел лет 5 в топ 1-3. Мобильной версии нет, рекламой не злоупотреблял (когда началось падение вообще ничего пол года не трогал до и после).
Статей 2800 только редакторских, средний объем ~7000 символов. Перечитывать и отправлять скрипту — просто нереально (проще с 0 запилить, наверное).
1. Переезжать на другой домен, заодно HTTPS подключить?
2. Как отреагирует ПС на то что домен будет новый?
Я бы исправил самые явные ошибки, улучшил сайт (ну например, мобильная версия таки будет не лишней) и переехал на новый домен с 301 редиректом.
///конкретные документы из-под фильтра вытащить можно. Но для этого нужно:
По трудозатратам — для нас сравнимо с написанием новой статьи, поэтому по такому пути мы пока не идем///
Привет 🙂 Так все таки, вы занимаетесь отдельными текстами попавшими под Баден?
Алгоритм: проверяем текст, убираем лишние n-граммы, убираем воду и стоп слова по максимуму, делаем 301 редирект. Так?
Я у себя что уж только не делал, да все результаты около нулевые, ресурсов и средств на опыты не хватает..
Нет, не занимаемся. Некоторые сайты прошерстили на наличие явных ошибок и перетащили на новые домены, на этом все.
Редакторы на бирже доработали 3 сайта, около 600 страниц .. пока позиции штормит , но роста трафика пока нет ..
Владимир, УРЛы у документов менялись?
Да сделал редирект и отправил на переобход страниц в яндекс вебмастер
А после правки текста и 301 редирректа на новый URL, как скоро можно ждать изменений?
В течение нескольких недель. Мы сделали сейчас несколько редиректов, я отчитаюсь как там все прошло.
Да, будет здорово, если отчитаетесь.
У меня пока наблюдения такие: траф после смены URL страницы с 301 редиректом от Яши восстанавливается на новой странице почти моментально, ну может в течении пары дней. Но восстанавливается в ровно том объеме, что и был на старом URL.
Есть, кстати, предположение, что вмести с Баденом Яндекс просто выкатил какой-то еще апдейт другого алгоритма, который не анонсировался. Хотя бы потому, что если при хостовом Бадене траф на сайт с Яши падает более чем на 90%, то при предпологаемом постраничном — траф на пострадавшие страницы входа (у меня по крайней мере) упал разве что процентов на 70% (с тенденцией дальнейшего медленного уменьшения).
Блин, жаль что с php5 и 5.6 не работает твой плагин….
Не могли бы вы скриншотом показать где именно в вордпрессе появляется кнопка на анализ. Не могу найти.
Источник: http://f-seo.ru/details/webmastering/baden-baden-kak-zhit-dalshe.html Как заработать деньги в интернете © Зарабатываем в пассивном режиме! Рекламная Сеть Яндекса и другие способы монетизации сайтов
Вот тут: https://yadi.sk/i/-oZRjvyz3MFQcq
Одна эта твоя статья, Смарт, намного полезнее, чем длиннющий вебинар на эту тему у Пузата 🙂
Респект и уважуха! За сервис и плагин — вдвойне!
Спасибо =)
А зафильтрованные сайты у вас метку какую в вебмастере получали? Переоптимизация?
Вот такую: https://yadi.sk/i/62c6wpYW3M8yHE
Алексей, что думаешь?
https://www.searchengines.ru/mobilnyj-yandeks-kontent.html
Пока ничего не думаю, наблюдаю просто. В хайпах участвовать никакого желания нет — каждые 2 месяца происходит какая-то новая херня, про которую все начинают писать — и которая потом никакого влияния не оказывает в краткосроке.
Предпоследняя — соглашения про персональные данные.
Последняя — новый поиск Яндекса.
Хорошая статья. Отдельное спасибо за конкретные решения и инструменты по выводу статей из под фильтра.
Можешь дать рекомендации по использованию ключевиков в альтах картинок?
Сталкивался с мнением, что ключи в альтах не участвуют при анализе документа, а участвуют в отдельном поиске по картинкам. Могли ключи в альтах оказать влияние на общую заспамленность документа при анализе (как раз 3-4 словники большинство)?
Если убирать ключи из альтов чем их стоит заменить (на картинках изображены ключевые слова)?
Имхо за спам посчитать могут. Мы ключами в альтах не спамим, в альт прописываем как правило ближайший подзаголовок из текста.
Читал, что Яндекс и Гугл по-разному относятся к тайтлу картинок. Яндекс использует их исключительно в ранжировании по поиску изображений. А Гугл включает их в простыню текста. В любом случае спамить ключами в альтах не рекомендуется, особенно копировать его на все картинки.
Мне кажется, вот этот список вам пригодится — https://contentmonster.ru/empty/list
Если вы его еще не заюзали, конечно )))
Попробовал в сервисе сравнить парочку статей, упавших после Бадена и парочку статей переживших сей алгоритм. По всем признакам у меня получилось, что попавшие под фильтр даже лучше не попавших… как все «скользко» в этом вашем СЕО )))
Решил, что буду просто придерживаться последней рекомендации — писать для решения проблемы людей.
Список на очереди =)
А «делать для людей» — универсальная рекомендация, и, самая лучшая к тому же! =)
Привет. Держи список стоп-слов от контентмонстра — https://contentmonster.ru/empty/list
Спасибо! Уже поставил задачу на импорт, зальем в ближ время =)
Ошибка в строке 68 файла FSeoTextToolClass в вашем плагине
Александр, цитирую себя же: Плагин для WP работает только с PHP7. Повод обновиться для всех!
=)
Алексей, если несложно, то перечисли 10 книг, которые ты считаешь маст рид для предпринимателя.
Алексей, мне кажется хрен тут перечислишь, вот реально. Каждой книге свое время — для кого-то это будет «оо, шарлотан Кийосаки выдал очередной бред, фу-фу-фу», а для кого-то — «нифигасебе! нужно растить активы и можно разбогатеть! вот это да, начинаем инвестировать!!!».
В целом же, наверное топ наиболее повлиявших лично на меня и мой бизнес книг будет такой:
1) Атлант расправил плечи, Айн Рэнд (фундаментально важная — позволяет понять, а надо ли вообще оно тебе? соответствует ли мотивация?).
2) Богатый папа, бедный папа, Роберт Кийосаки.
3) Самый богатый человек в Вавилоне, Джордж Клейсон.
4) Начни с главного, Гарри Келлер (открытие прошлого года).
5) Цель, Элияху Голдратт (открытие прошлого года).
6) От хорошего к великому, Джим Коллинз (открытие прошлого года).
7) Антихрупкость, Нассим Талеб (открытие этого года, идет правда пиздец медленно — очень много обдумывать приходится после каждый 20 страниц).
Вот тут я сходу не смог продолжить список, видимо, глобально повлиявшие на меня книги закончились. Добью очень крутыми, но не глобальными:
8) Как я создавал Уол-Март, Сэм Уолтон (автобиография, но оч поучительная).
9) Моя жизнь, мои достижения, Генри Форд (автобиография, аналогично Уолтону).
10) Представьте себе, Том Питтерс (книга хоть и чуть устарела, ей уже около 10 лет вроде — но позволяет взглянуть на все происходящее в мире под чуть-чуть другим углом).
Спасибо!! Вещь!
Что-то не активируется плагин. Пишет вот что:
Parse error: syntax error, unexpected ‘:’, expecting ‘;’ or ‘{‘ in /home/………/public_html/wp-content/plugins/fseoteam-f-seo-text-tool-00ae2757c4b7/FSeoTextToolClass.php on line 68
А так идея хорошая
Цитирую себя же: Плагин для WP работает только с PHP7. Повод обновиться для всех!
=)
Теперь вижу, да). Сорри. Почему-то сразу комменты не подгрузились…
Кеш вездесущий, все в порядке =) Ну или просто по времени на пару минут разминулись =)
Update для всех. Плагин для WP работает только с PHP7. Повод обновиться для всех!
Для всех по водным словам. Пока работает только подсветка одиночных сомнительных слов (всякие «однако», «наверное» и прочие мы уже вылавливаем), планируем сделать подсветку словосочетаний.
Добавляйте все сомнительное говно в словарь, только вместе мы сможем сделать нормальный инструмент!
существенно проработали все статьи на одном из сайтов — что именно сделали, кроме сокращения спамных н-грамм?
Больше ничего не сделали, только убрали спамные н-граммы. Собственно, отсюда и вывод — что этот путь не работает.
Не смогла поставить плагин — фатальная ошибка. А что делать с зелеными и красными подсветками?
Евгения, зеленые и красные подсветки — повод подумать, нужно ли исправлять текст. Можно с ними что-то делать, а можно не делать ничего.
Спасибо за полезную информацию. Хотелось бы уточнить про инструмент для анализа статьи. В тексте удаляете все повторяющиеся н-граммы или есть какие-то лимиты?
Дмитрий, лимитов нет. Подсветка просто привлекает внимание к проблемным местам, а уж что с ними делать — каждый решит сам.
Каких-то рекомендаций по %% н-грамм или %% слов в тексте у меня нет.
Задача инструмента — подсветить все спорные части в тексте — а дальше уже нужно принимать решение тому, кто этот текст собирается публиковать.
Добрый день! Спасибо за статью. Не планируете ли сделать расширение для браузера для проверки, или отдельный сервис? Можно платный) Просто не у всех wp(
Илья, расширение для браузера делать не планируем пока. У нас просто везде WP, а сервис же в первую очередь для внутреннего использования пилим =)
Круто, буду пользоваться, но у меня водность 0% в статьях показывает, эта типа очень хорошо или это баг?
Инструмент водности пока не готов, в ближайшее время запилим. Щас тестируем =)
Хотели просто побыстрее выкатить для всех анализ н-грамм, так как многие просили и много было вопросов в стиле «что же делать с баденом».
Алексей, спасибо за информацию и полезную штуку по анализу текста. Радует, что в нормы я прекрасно продолжаю вписываться. Все-таки твоя школа, и знания, полученные от тебя, реально бесценны. Спасибо большое тебе за все!
Озадачили только вот все эти жалобы выше на критическую ошибку плагина при установке… Есть ли те, кому удалось благополучно поставить и получить работоспособный инструмент прямо на сайте? Бегетовцы, оставьте отзыв — может, от хостинга зависит… Кто-нибудь поставил плагин без фатальной ошибки?
Татьяна, спасибо за теплые слова! =)
Плагин действительно не ставится, в ближайшее время подправим и я залью новую версию. Напишу и в статье и в комментах.
обновила до РНР 7 — плагин установился, но то ли я слепая, то ли кнопка не появилась… Леш, в каком месте она должна быть?
сорри, все нашлось и работает. Спасибо!
Пожалуйста!
Заодно и обновилась (в большинстве случаев ПХП7 работает порезче, хостинг в итоге выдерживает больше посетителей), что тоже хорошо =)
Спасибо за статью, Леша) офигенная. Есть пару сайтов под фильтром. Переработаю и перенесу на новый домен. О результатах напишу тут)
Морозушка, ждем отчета! =)
Плагин не был активирован, потому что он вызвал фатальную ошибку.
Parse error: syntax error, unexpected ‘:’, expecting ‘;’ or ‘{‘ in ………/plugins/fseoteam-f-seo-text-tool-00ae2757c4b7/FSeoTextToolClass.php on line 68
Плагин не работает, выдает ошибку
Плагин не был активирован, потому что он вызвал фатальную ошибку.
Parse error: syntax error, unexpected ‘[‘ in /home/site.ru/public_html/wp-content/plugins/fseoteam-f-seo-text-tool-00ae2757c4b7/FSeoTextToolClass.php on line 14
WP 4.5
PHP 5.3
Не получилось.
Плагин не был активирован, потому что он вызвал фатальную ошибку.
Parse error: syntax error, unexpected ‘:’, expecting ‘;’ or ‘{‘ in /home/a/………………………../public_html/wp-content/plugins/fseoteam-f-seo-text-tool-00ae2757c4b7/FSeoTextToolClass.php on line 68
Плагин не был активирован, потому что он вызвал фатальную ошибку.
Parse error: syntax error, unexpected ‘:’, expecting ‘;’ or ‘{‘ in /var/www/site.ru/wp-content/plugins/fseoteam-f-seo-text-tool-00ae2757c4b7/FSeoTextToolClass.php on line 68
Чтото новый сервис благополучно падает=\
Задосили, чо =)))
А чем инструмент отличается от бубна Трудова, коль Вы все равно опираетесь на его исследования?
И использование сервиса или плагина совсем бесплатное что ли?)
Кстати, плагин выдает ошибку — http://joxi.ru/LmGpkKVueLdjB2
Использование бесплатное. Отличается тем — что мы делали для себя более узко-специализированный сервис и будем его постепенно улучшать.
Задача — дать возможность принимающему новый текст у копирайтера быстро понять, не совсем ли плохой текст (ну тупо окинуть взглядом на количество и качество подсветки — и увидеть, воды много, язык бедный — текст говно — или наоброт).
Мы планируем развивать инструмент анализа постепенно, в меру сил =)
Чото то не активируется
http://prntscr.com/g9jh36
Parse error: syntax error, unexpected ‘[‘ in /var/www/u0337668/data/www/XXX/wp-content/plugins/fseoteam-f-seo-text-tool-00ae2757c4b7/FSeoTextToolClass.php on line 14
При установке плагина возникает ошибка:
Parse error: syntax error, unexpected ‘:’, expecting ‘;’ or ‘{‘ ../wp-content/plugins/fseoteam-f-seo-text-tool-00ae2757c4b7/FSeoTextToolClass.php on line 68
Ребята, багрепорт по установке плагина передал в техотдел, подправим. Я напишу в комментах и в апдейте статьи как зальем новую версию.
текст описательный нужен для коммерческих сайтов где главное не текстуха а параметры товара?
Считаю не нужен в современных реалиях, но я ваще не гуру в коммерческом SEO. Имхо, лучше поинтересоваться у баблоруба.
Отличный материал, спасибо за инструмент
а нет ли случайно в планах инструмента, который будет по пачке урлов показывать насколько плохие тексты на том или ином урле?
У нас нет, даже в планах такого нет. Там же нужно отделять сам текст от всего остального — комментов, навигации, служебных элементов. Решили поэтому пойти от обратного — засылать текст из ВП на проверку.
Проверил несколько документов, попавших под санкции. Академическая тошнота там превышает норму во всех документах.
Только нужно иметь в виду, академическую тошноту мы считаем по традиционной формуле — сумма %% повторов пяти самых частых слов. Т.е. это такой косвенный знак того, что язык текста бедноват (ну или что реально в тексте спамили словами).