Click here to visit our sponsor
Earn some money with Bulgarian Pay-Per-Click network

Отдалечен достъп до лексикални ресурси

BULGARIAN ENGLISH

Практическо ръководство по програмиране на Паскал

От няколко години в катедра “Компютърна информатика” на ФМИ при ПУ автоматизирано се изгражда система от машинни речници (лексикална база на българския език) и морфологичен процесор. Поради особената трудоемкост на процеса на изграждане на ЛБ тя е обект на интерес от редица специалисти в областта на езикознанието (лексикология, морфология, синтаксис) и компютърната лингвистика. От гледна точка на изключително огромния обем на базата е невъзможно нейното тестване в кратки срокове. При предоставянето й заедно със системите за достъп до нея на заинтересовани специалисти се губи непосредствената обратна връзка с тях. Затова най-удобният начин за предоставяне на ресурсите на изградената ЛБ на заинтересовани потребители е компютърната мрежа. Системата е инсталирана на сървър, а достъпът до нея се осъществява по удобен начин чрез използуване на WWW и интерфейса CGI. Той позволява задаване на заявка към системата, която работи под управлението на WINDOWS’95 върху сървъра и резултатът от заявката се връща по мрежата. Предимство на този подход е достъпът на голям брой потребители до съответната ЛБ и възможността за детайлно тестване на системата. От голямо значение е и бързата обратна връзка с потребителя при възникване на проблемни ситуации. По такъв начин от една страна е възможно в кратки срокове да се тества системата и ЛБ, а от друга - да се разшири със справки, които липсват по желание на потребителите.

Основни функции на системата са:

- извършване на морфологичен анализ по въведено от потребителя изречение на български език;

- проверка на синтактичното съгласуване на две думи на български език, въведени от потребителя;

- морфологичен синтез на парадигма по произволна нейна словоформа;

- справки в лексикалната база.

Ново: Българо-английски речник

Изискванията към потребителя са - наличие на персонален компютър (IBM/PC съвместим), WINDOWS и програма за достъп до WWW с кирилизация. Поради различните кодови таблици не е предвиден засега достъп чрез други платформи (Macintosh, Unix).

Перспективите за развитие са в следните направления:

- разширяване функциите на системата и увеличаване на броя на справките;

- разполагане на текстови корпуси на българския език за изследване и даване на стандартни средства за потребителски изследвания;

- разработване на допълнителни средства позволяващи интерактивно обучение по лексикология и морфология чрез използуване на системата;

- осъществяване на достъп до системата и за потребители, използуващи други платформи(Macintosh, Unix).

 

   КОМЕНТАРИ И ПРЕПОРЪКИ    

Моля, споделете с нас вашите забележки, коментари, критики, препоръки и мнения относно достъпа до лексикалната ни база. Ние ще влезем във връзка с вас, ако ни предоставите и информация за контакти!

Коментар:

Категория

Информация за контакти:

Име*:
Длъжност:
Фирма/звено:
Адрес:
Телефон:
Факс:
E-mail*:

* Необходима информация

Тази страница е направена за да популяризира изследванията в областта на компютърната лингвистика (компютърна лексикография, морфология, синтаксис, анализ и синтез на български текст) в ПУ "Паисий Хилендарски". Повече информация за българския лингвистичен софтуер, морфологичния процесор и електронните (машинни) речници може да намерите на личната страница на Христо Крушков.

Dir.bg
Listed in
Vote for our site!