Добавить в корзинуПозвонить
Найти в Дзене
Роман Чертанов

Как алгоритм может проверять вариативные написания тся/ться, н/нн, слитно/раздельно

По ссылкам ниже представлены мои статьи о том, как можно проверить указанные вариативные написания без использования нейросети, относительно простым алгоритмом старого типа. Алгоритм должен смотреть на предыдущее или следующее слово или несколько слов, анализируя их часть речи, род, число и падеж. Много ли будет ложных срабатываний или «недолётов» — покажет тестирование, поскольку речь идет о гипотетическом программном обеспечении. Требуемые знания о словах — это их часть речи, род, число и падеж. Это программа 3 класса советской средней школы. Знания о частях речи — существительные, прилагательные, глаголы, причастия, предлоги, наречия и предикативы (новая переклассификация части наречий как «половинок» составного сказуемого по образцу «надо стараться»). Эта информация содержится в словарях (например, Зализняка) для всех возможных словоформ, либо принимается как исчерпывающий список конкретных слов. Возможно включение более полной проверки, когда потенциально сомнительные места имею

По ссылкам ниже представлены мои статьи о том, как можно проверить указанные вариативные написания без использования нейросети, относительно простым алгоритмом старого типа.

Алгоритм должен смотреть на предыдущее или следующее слово или несколько слов, анализируя их часть речи, род, число и падеж.

Много ли будет ложных срабатываний или «недолётов» — покажет тестирование, поскольку речь идет о гипотетическом программном обеспечении.

Требуемые знания о словах — это их часть речи, род, число и падеж. Это программа 3 класса советской средней школы. Знания о частях речи — существительные, прилагательные, глаголы, причастия, предлоги, наречия и предикативы (новая переклассификация части наречий как «половинок» составного сказуемого по образцу «надо стараться»). Эта информация содержится в словарях (например, Зализняка) для всех возможных словоформ, либо принимается как исчерпывающий список конкретных слов.

Возможно включение более полной проверки, когда потенциально сомнительные места имеют особый цвет отметок (например, синие подчёркивания).

Неоднозначными могут остаться определения алгоритмом некоторых случаев «тся/ться» и «тоже/то же», «также/ так же». Но неоднозначности зависят и от стилистики текста. Рекомендуется не разделять составное сказуемое (по образцу «любит учиться») и всегда писать «то же самое» и «точно так же», чтобы «уйти» еще и от пометок неопределённости. Это даст однозначно интерпретируемый «тупо-компьютером» текст с дополнительным побочным эффектом: вполне вероятно, что его окажется легче читать и переводить.

Полностью непроверяемыми оказываются сочетания «за чем» (за шкафом) и «по чему» (по тропе). Это не является трагедией, потому что это, как и «ться», — одни из самых простых правил грамматики для интерпретации человеком, но одна из неразрешимых задач для простых алгоритмов.

1. «Не» слитно или раздельно при компьютерной проверке правописания

https://dzen.ru/a/aCtEmCxd9Wyv_JAi

2. Слитное и раздельное написание: механические признаки

https://m.dzen.ru/a/aCzqPw_nonrqUVHj

3. Алгоритмическая проверка «-ться» и «-тся»

https://m.dzen.ru/a/aDtUfLbt7Alba30F

4. Автоматическая проверка написаний «н/нн»

https://m.dzen.ru/a/aDugAj1J62KRQf3q