ROTEL

ROTEL - Sisteme inteligente pentru Webul semantic, bazate pe logica ontologiilor si tehnologiile limbajului. Aplicaţii pentru limba romana

Principalul scop al ROTEL este proiectarea, implementarea şi evaluarea unei platforme inteligente, bazate pe conţinut, pentru a asista inginerul de cunoştinţe în construirea unei aplicaţii pentru Web-ul Semantic care să permită utilizarea limbii române în mediul multilingv al Web-ului.

Obiective

extragerea inteligentă a informaţiei conţinute în surse Web (structurate, semi-structurate, text);
integrarea şi interogarea bazate pe semantică a surselor Web disparate (care nu au fost dezvoltate iniţial ţinându-se cont de această cerinţă de interoperabilitate);
utilizarea ontologiilor şi regulilor pentru a permite raţionamentul automat asupra conţinutului surselor;
utilizarea şi îmbunătăţirea standardelor şi tehnologiilor existente;
crearea resurselor de limbaj natural care să faciliteze prelucrarea eficientă, bazată pe conţinut a documentelor. Resursele şi instrumentele specifice limbii vor fi dezvoltate conform celor mai bune practici internaţionale, pentru o uşoară integrare în mediul multilingv standardizat de prelucrare;
dezvoltarea unei clasificări bazate pe conţinut a documentelor, conform ontologiilor specifice domeniilor, şi generarea, pentru documentele astfel clasificate, a meta-datelor, conform ultimelor standarde ale Web-ului Semantic;
dezvoltarea de servicii sofisticate pentru sistemele de întrebare-răspuns pentru limbile naturale (limba română) care privesc conţinutul documentelor, rezumarea, asistenţa inteligentă în citirea documentelor în limbi străine etc.

Caracteristicile sistemului

·Deoarece construirea unei aplicaţii complete de Semantic Web cu tehnologia actuală este extrem de laborioasă şi costisitoare, în proiectul de fata ne propunem construirea unui mediu inteligent de dezvoltare a aplicaţiilor de acest tip. Un astfel de mediu va pune accentul pe utilizarea mecanismelor de raţionament în prelucrarea cunoştinţelor domeniului aplicaţiei (ontologii, adnotări, reguli, restricţii) şi va utiliza tehnici de invăţare automată pentru simplificarea majorităţii aspectelor şi etapelor de dezvoltare ale unei aplicaţii de Semantic Web.

Sistemul va oferi atât componente necesare pentru designul unei aplicaţii SW, cât şi o componentă de interogare care preia o cere utilizator şi accesează numai sursele Web relevante utilizănd cunoştinţele specifice domeniului.

Proiectul işi propune abordarea problemelor legate dSemantic Web intr-un cadru cât mai complet. Proiectul ROTEL va demonstra avantajele combinării cunoştinţelor de domeniu (reprezentate ca ontologii formale, conforme principiilor susţinute de Semantic Web Services Language Committee) şi cunoştinţelor lingvistice (reprezentate prin ontologii lexicale şi diferite modele de limbă). Această demonstraţie se va baza pe tehnici de Regăsire a Informaţiei Semantice şi de Extragere a Cunoştinţelor din documente.

Facilităţi legate de design-ul aplicaţiei

crearea şi actualizarea ontologiilor lexicale şi de domeniu;
stabilirea regulilor pentru descrierea semanticii operaţionale a ontologiei;
dezvoltarea unui sistem care să genereze adnotări semantice ale documentelor
dezvoltarea unui sistem de extragere de termeni şi de clasificare tematică pentru o mulţime închisă (dar extensibilă) de domenii suportate de ontologiile locale;
dezvoltarea unui sistem de aliniere pentru dezambiguizarea termenilor dintr-un text şi pentru echivalarea lor cu elemente ale ontologiilor folosite;
o interfaţă grafică pentru asistarea inginerului de cunoştinţe în procesul descrierii regulilor de corespondenţă dintre formatele locale ale surselor şi ontologia domeniului;
o interfaţă grafică care să asiste inginerul de cunostinţe în procesul de construire a «wrapper»-elor
folosirea instrumentelor de adnotare pentru paginile HTML şi pentru serviciile Web;
utilizarea unor metode de învaţare automată pentru a obţine cunostinţe despre schema sursei de informaţie şi despre conţinutul acesteia (tipurile şi domeniile datelor, restricţii de cardinalitate, diverse statistici legate de numărul de "înregistrări" şi timpul de acces la surse, cunostinţe despre conţinutul semantic al surselor, legăturile dintre surse, suprapuneri între surse, completitudinea surselor, etc)

Componenta de interogare «inteligentă»

arhitectura bazată pe mediere şi planificarea interogărilor pentru tratarea interogărilor semantice
utilizarea informaţiilor despre conţinutul şi capabilităţile surselor la planificarea interogărilor în scopul realizării accesului eficient la surse
tratarea problemei compunerii serviciilor Web la planificarea interogărilor
o interfaţă grafică care să asiste utilizatorul aplicaţiei în construirea simplă a interogărilor
o interfaţă în limbaj natural care să permită utilizatorului să obţină răspunsuri la anumite întrebări, exprimate în limba română, legate de documentele dintr-un anumit domeniu tematic;
un sistem de rezumare a documentelor, care să furnizeze rezumate de lungime controlată a documentelor relevante;
prezentarea rezultatelor interogării în format navigabil.