Синонимайзер

Синонимайзер

Синонимайзер — программа, осуществляющая замену слов или фраз во введённом тексте на синонимы, находящиеся в базе данных, с целью видоизменения текста и придания ему уникальности. Чаще всего используется при создании уникального контента в Интернете.

Может быть оформлена в виде сайта в Интернете, скрипта и т. п.

Иногда синонимайзер называют так: синомизатор, синомайзер, синонимизатор. Термин впервые введён копирайтером под ником Кевиндарк на одном из SEO-форумов для описания программы, которая облегчает рерайтинг текстов. Однако сейчас под этим словом понимается программа, способная автоматически изменять правку, возможно, с контролем качества человека.

Содержание

Принципы работы

Все синонимайзеры можно разделить на ручные и автоматические. Ручные синонимайзеры предлагают пользователю самому выбирать подходящие синонимы из списка доступных, автоматические программы и сервисы проделывают всю работу над текстом без участия человека.

Для автоматического синонимайзинга используются два типа замен: безморфологические (строковые) и морфологические (словарные).

  • Безморфологические (строковые) замены проводятся тогда, когда часть текста, имеющая с двух сторон не буквенные символы (пробелы, знаки препинания и другие), полностью совпадает с текстом, указанным в замене.
  • Морфологические (словарные) замены учитывают морфологию, заменяя слова в любой словоформе на их синонимы в соответствующей словоформе. Некоторые программные продукты способны изменять словосочетания на словосочетания (длиной до десяти слов).

Часть синонимайзеров способна проводить оба типа замен, остальные только один из них. В случае, если программа не способна понимать морфологию, то база под неё склоняется в разные словоформы вручную или с помощью утилит, называемых склоняторами. Некоторые программы-синонимайзеры способны обрабатывать регулярные выражения или простые скриптовые языки.

Из-за того что в некоторых контекстах синонимы могут не подходить (например, замена «Российская» на «Русская» в словосочетании «Российская Федерация»), в большинстве синонимайзеров предусмотрен механизм исключений. Подобные словосочетания заносятся в базу и не обрабатываются.

Проблема создания качественного синонимайзера

На сегодня не было разработано ни одного синонимайзера, обрабатывающего русскоязычный текст так же хорошо, как и человек. Главные проблемы в создании качественного синонимайзера связаны со следующим:

  • подбор синонимов должен зависеть от контекста фразы;
  • русский язык не ставит жестких рамок касательно последовательности слов в предложении, что затрудняет синтаксический анализ;
  • чтобы синонимизированный текст читался легко, при работе синонимайзера должен учитываться закон Зипфа (проще говоря, частые слова нужно заменять частыми, а редкие — редкими).

Дополнительная обработка

Статьи, полученные путем генерирования при помощи синонимайзера, требуют обязательной дальнейшей обработки программами для пакетного сравнения текстов. В процессе обработки полученные тексты сравниваются между собой, после чего отбираются наиболее уникальные варианты. Материалы с малой долей уникальности не пригодны для дальнейшего использования.

См. также



Wikimedia Foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Полезное


Смотреть что такое "Синонимайзер" в других словарях:

  • Синонимы — У этого термина существуют и другие значения, см. Синоним (значения). Синонимы  слова одной части речи, различные по звучанию и написанию (ср. омонимы), но имеющие одинаковое или очень близкое лексическое значение (ср. антонимы). Примеры… …   Википедия

  • Рерайтинг — Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Проставить интервики в рамках проекта Интервики …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»