LanguageTool 0.8.9

У цьому форумі обговорюються всі технічні питання, які стосуються програмного забезпечення тощо

Модератори: Танка, vitaly1, Листопад

Відповісти
Andriy
Редактор вмілий
Повідомлень: 485
З нами з: П'ят листопада 10, 2006 2:38 pm

LanguageTool 0.8.9

Повідомлення Andriy »

http://www.danielnaber.de/languagetool/

ПЗ перевірки граматики, версія 0.8.9 включає початкову підтримку української мови:
- деякі правила пунктуації: виокремлення комами "будь ласка", деяких вставних слів, кома перед "але"...
- спроба започаткувати перевірку милозвучності (в/у) (поки що дуже експериментальна)
- виловлювання деяких калькувань, напр., співпадати->збігатися...
а також деякі, спільні для всіх мов: парність дужок, дві коми, прогалина перед комою...

Засіб існує у вигляді розширення для OpenOffice.org, а також окремі версії: командного рядка, версія з GUI, а також у вигляді сервера http.

Підтримка української мови потребує допомоги, ласкаво просимо всіх бажаючих!

Наразі створено сторінку проекту для роботи над базою знань про українську мову, яка могла б служити вихідною точкою для проектів перевірки орфографії *spell-uk, граматики в LanguageTool та потенційно будь-якого іншого застосування в галузі лінгвістики.
Основознавець
Мовознавець геніяльний
Повідомлень: 961
З нами з: Чет липня 31, 2008 11:15 pm

LanguageTool 0.8.9

Повідомлення Основознавець »

Вельми цікава річ, справді, але залишається цікавим одне: чому це не реалізувати в *Spell-двигун? А ускладнювати додатковою програмою? Звісно, зрозуміло, що це лише розширення для OpenOffice.org і воно не має вагомого значення. Якби це було у рамках *Spell-uk, то я б взяв якусь участь.
Andriy
Редактор вмілий
Повідомлень: 485
З нами з: П'ят листопада 10, 2006 2:38 pm

LanguageTool 0.8.9

Повідомлення Andriy »

Основознавець писав:
П'ят серпня 01, 2008 4:09 pm

Вельми цікава річ, справді, але залишається цікавим одне: чому це не реалізувати в *Spell-двигун? А ускладнювати додатковою програмою? Звісно, зрозуміло, що це лише розширення для OpenOffice.org і воно не має вагомого значення. Якби це було у рамках *Spell-uk, то я б взяв якусь участь.

проблема в тому, що двигуни перевірки орфографії заточені під перевірку орфографії, вони перевіряють лише слова, тобто для перевірки граматики вони аж ніяк
словники для перевірки орфографії є лише переліком слів з правилами відмінювання (для нормалізації)

для перевірки граматики, окрім правильних форм слів, треба їх частини мови, час, особу, правила узгодження, правила розташування слів в реченні, правила пунктуації…

поточно, на базі spell-uk можна побудувати досить потужну базу для корпусу, що буде використовуватися для перевірки граматики в LT, але окрім того треба буде написати на xml купу правил української мови…

якщо Вас таке зацікавить буду радий і можу допомогти
Основознавець
Мовознавець геніяльний
Повідомлень: 961
З нами з: Чет липня 31, 2008 11:15 pm

LanguageTool 0.8.9

Повідомлення Основознавець »

Andriy писав:
П'ят серпня 01, 2008 4:09 pm
поточно, на базі spell-uk можна побудувати досить потужну базу для корпусу, що буде використовуватися для перевірки граматики в LT, але окрім того треба буде написати на xml купу правил української мови…

якщо Вас таке зацікавить буду радий і можу допомогти
Геть нічорта не зрозумів стосовно взаємозв'язку spell-uk та LT, але якщо Ви мали на увазі написати на xml правила до spell-uk на основі LT, тоді я за! Поясніть більш детально, будь ласка. Гадаю, що можна таким потужним проектом й зайнятись, — основна ідея програми дуже подобається. Хоча з часом скрутно, але повзання також рух/wink.gif" style="vertical-align:middle" emoid=";)" border="0" alt="wink.gif" />
Якщо Вам легше — можете написати у приватні повідомлення.
Andriy
Редактор вмілий
Повідомлень: 485
З нами з: П'ят листопада 10, 2006 2:38 pm

LanguageTool 0.8.9

Повідомлення Andriy »

Основознавець писав:
П'ят серпня 01, 2008 4:09 pm

Геть нічорта не зрозумів стосовно взаємозв'язку spell-uk та LT, але якщо Ви мали на увазі написати на xml правила до spell-uk на основі LT, тоді я за! Поясніть більш детально, будь ласка. Гадаю, що можна таким потужним проектом й зайнятись, — основна ідея програми дуже подобається. Хоча з часом скрутно, але повзання також рух/wink.gif" style="vertical-align:middle" emoid=";)" border="0" alt="wink.gif" />
Якщо Вам легше — можете написати у приватні повідомлення.

для того, щоб правила були корисні треба спочатку побудувати базу слів з їх атрибутами, оскільки це краще робити на базі словників spell-uk я можу цим зайнятися, щоб ви могли просто працювати з правилами...
в будь-якому разі вам варто ознайомитися з коротким описом ось тут і поставити собі LT
я спробую на вихідних підготувати базу слів і запхнути її в репозитарій LT, щоб зразу можна було з ними працювати

якщо будуть питання по правилах — пишіть, в приват не знаю чи варто, можливо хтось ще зацікавиться

також якщо треба буде коротший шлях спілкування лишіть контакт IM в приваті, тоді можна буде спілкуватися онлайн
Основознавець
Мовознавець геніяльний
Повідомлень: 961
З нами з: Чет липня 31, 2008 11:15 pm

LanguageTool 0.8.9

Повідомлення Основознавець »

Гаразд, встановив собі я цю програму звантаживши з та надибав відразу деякий недолік. Як я зрозумів, там вже були Ваших пару правил. Отже, я використав варіант "Реабілітувався в Львівському". При тому вона мені пропонувала вилучити "в львівському", замінивши на "у". Я збагнув, що це помилка правил, але, що саме смішне, його немає в grammar.xml .Тут є знімок.
Щодо інтерфейсу, то він доволі приємний. Та й є питання: Що то за replace.txt, що лежить поряд з grammar.xml?
Ще мене цікавить, чи можливо вводити правила не до кожного слова, а лише до комбінації останніх та перших літер?

І ще одне, щось він довго працює.
Andriy
Редактор вмілий
Повідомлень: 485
З нами з: П'ят листопада 10, 2006 2:38 pm

LanguageTool 0.8.9

Повідомлення Andriy »

Основознавець писав:
Суб серпня 02, 2008 4:09 pm

Гаразд, встановив собі я цю програму звантаживши з та надибав відразу деякий недолік. Як я зрозумів, там вже були Ваших пару правил. Отже, я використав варіант "Реабілітувався в Львівському". При тому вона мені пропонувала вилучити "в львівському", замінивши на "у". Я збагнув, що це помилка правил, але, що саме смішне, його немає в grammar.xml .Тут є знімок.
Щодо інтерфейсу, то він доволі приємний. Та й є питання: Що то за replace.txt, що лежить поряд з grammar.xml?
Ще мене цікавить, чи можливо вводити правила не до кожного слова, а лише до комбінації останніх та перших літер?

І ще одне, щось він довго працює.

1. там лише декілька правил і це була здебільшого проба пера, тобто ці правила треба міняти
2. правило, на яке ви наштовхнулись там у grammar.xml:
<rule>
<pattern>
<token regexp="yes">.*[аеєиіїоуюя]</token>
<token regexp="yes">у</token>
<token regexp="yes" negate="yes">в.*</token>
</pattern>
<message>Зіяння <suggestion>\1 в</suggestion></message>
<example type="correct">Балка в степу.</example>
<example type="incorrect"><marker>Балка у степу</marker>.</example>
</rule>
3. так можна, треба використовувати атрибут regexp, власне, правило вгорі і є таким прикладом — воно намагається узгоджувати в/у з кінцевою голосною попереднього слова

щодо довго працює, я подивлюсь чи це від того, що для української зараз не вживається FSA, а береться сирий словник spell-uk, якщо це так, то це буде виправлено
Andriy
Редактор вмілий
Повідомлень: 485
З нами з: П'ят листопада 10, 2006 2:38 pm

LanguageTool 0.8.9

Повідомлення Andriy »

4. replace.txt - це була спроба створити простіший формат (без громіздкого xml) для простої заміни слів, здебільшого русизмів, але я не впевнений, що він лишиться
Відповісти