UniTurk

В рамках конференции TEL будет организован очередной семинар UniTurk.

В феврале 2014 года в Казани был принят рабочий вариант унифицированной морфологической разметки для корпусов тюркских языков. Принятый вариант ориентируется на морфемную структуру тюркской словоформы и призван максимально полно отразить многообразие различных тюркских языков. Подобная унифицированная система разметки могла бы также служить в качестве универсального средства глоссирования текстовых примеров (например, в международных публикациях).

Для обсуждения на очередном семинаре Uniturk предлагаются следующие вопросы:

  1. Грамматическая (морфологическая и словообразовательная) и семантическая разметка. Разграничение семантических и грамматических тегов (разряды числительных, залоги и т.п.). Представление полифункциональных аффиксов.
  2. Вопрос о степени полноты и детализации разметки.
  3. Проблема синтетического и аналитического выражения отдельных категорий в разных языках (например, т.н. “инструментальный падеж”, способы выражения вопросительности, модальности и т.п.).
  4. Представление глагольных аффиксов: подготовка сопоставительных таблиц.
  5. Семантические разметка: анализ существующих подходов.

Мы ждем ваших предложений по вопросам унификации систем аннотаций, которые будут размещены на сайте семинара.

На веб-странице семинара можно ознакомиться с существующими системами разметки и публикациями по данной тематике.