Перейти к содержанию

Синтаксический анализатор


Рекомендуемые сообщения

Опубликовано

Добрый вечер, необходимо сделать синтаксический анализатор.

Суть такова: имеется предложение, для каждого слова известны его морфологические признаки(часть речи, падеж, род, число, лицо). Нужно провести синтаксический анализ и построить граф зависимости для этого предложения.

Может у кого есть идеи как это можно сделать?

Опубликовано

Да продолжение.

Вообще он называется графом зависимостей, но можно сказать что это дерево. Нужно что-то типа в treeView или в еще где-нибудь(это не очень важно) выводить структуру, 1-ый уровень сказуемое, 2-ой уровень - подлежащее, 3-ий - зависимое слово и т.д.

На третьем уровне могут быть несколько слов.

Вот нашел пример.

%D0%BE%D0%B1%D0%B5%D1%81%D0%BF%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5.PNG

Только мне не нужен, мне нужна идея.

Опубликовано

ну это понятно.

а если сложное предложение? наверно корень лучше использовать заглушку. а от нее уже плясать.

в чем у вас проблема? определить кто к чему относится?

зы дерево, по проще скажем, граф не имеющий циклических связей.

ну судя по вики вы говорите о дереве.

Только мне не нужен, мне нужна идея.

есть какие либо упрощающие ограничения или wild world.

Опубликовано

1. Что то не понял. Какая заглушка? ЧТо это?

2. Да, как определить что к чему относится.

Допустим в предложении есть слово "слово" - морф инф-ция: 1 вариант: сущ, ед.ч, им.п.;2 вариант: сущ, вин.ч, им.п.

Возможно в этом случае выбор будет делаться из того, есть ли еще в данном предложении сущ. или местимения в имен.падеже. Опять же если есть такое слово, то где гарантия, что его можно воспринимать тоолько в им. падеже?

Может нужно создать файл, в котором будут прописаны все соответствия между словами, то есть как сущ. соотноситься с прилаг.?

3. Ограничений нет. wild world. только если взять за ограничение словарь.

Опубликовано
2. Да, как определить что к чему относится.

правила русского языка.

иначе никак.

Допустим в предложении есть

так и рассматривают предложение , слово в контексте, а не отдельно.

если же есть варианты в отношение отдельного слова, то проверка вариантов на зависимых приведет к правильному выбору гипотезы.

Может нужно создать файл,

"базу" знаний для программы конечно создавать необходимо. иначе никак.

Опубликовано

buterforever, Серега? )))))

а мы ждем твой синтаксический анализатор, чтобы доделать переводчик =Р чувствую мы его не скоро получим? ))))

по теме: большие проблемы возникнут с местоимениями, т.к. о них информации никакой (морфологический анализатор не поддерживает).

к примеру, мы ждем твой синтаксический анализатор.

Информация из морф.анализатора:

мы - местоимение
ждем - глагол, мн.ч., 1 лицо.
твой - местоимение
синтаксический - прилагательное (1.ед.ч, м.р, им.п. / 2.ед.ч, м.р, вин.п.)
анализатор - сущ. (1.ед.ч, муж.р, им.п. / 2.ед.ч, муж.р, вин.п.).

вот из этого надо построить дерево.

Опубликовано

buterforever, было бы отлично, если бы это поддерживалось. т.к. в используемом нами анализаторе, этого нет. Не говоря уже о таких частях речи как наречие, причастие, деепричастие.

Опубликовано

0xDEADBEEF, товарищь buterforever занимается русским.

мы занимаемся переводом, у нас как такого анализатора нет, у нас будут правила построения предложений на английском.

Опубликовано

TolkienDRR

нормуль. наконец то прекратили квадратики и линеечки задавать

http://lemmatizer.org/ru/

Добавлено спустя 1 минуту 10 секунд:

наш переводчик -

и какой критерий будет при сдаче проекта ?

Опубликовано

coder, пока у нас несложный текст на 1.5 страницы А4 на русском. "Терпимый" перевод на английский язык, с правильным построением фраз.

Морфологический анализатор русского языка используем чужой, а синтаксическим (тоже русского языка) видимо buterforever занимается.

Опубликовано

CooDi, что ж так долго молчал то xD

buterforever, думаю имелось ввиду (для примера, Программное обеспечение вычислительной техники автоматизированных систем):

te.jpg

Опубликовано
обратите внимание на то, что слово может зависеть только от одного слова, не больше.
но может быть меньше. корень дерева... но тут больше проблема возникает не в представлении дерева, а в правилах его построения.

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...