| |
ROTEL - Sisteme
inteligente pentru Webul semantic, bazate pe logica ontologiilor si
tehnologiile limbajului. Aplicaţii pentru limba
romana
Principalul scop al ROTEL este proiectarea, implementarea şi evaluarea unei
platforme inteligente, bazate pe conţinut, pentru a asista inginerul de
cunoştinţe īn construirea unei aplicaţii pentru Web-ul Semantic care să
permită utilizarea limbii romāne īn mediul multilingv al Web-ului.
Obiective
-
extragerea inteligentă a informaţiei conţinute īn surse Web (structurate,
semi-structurate, text);
-
integrarea şi interogarea bazate pe semantică a surselor Web
disparate (care nu au fost dezvoltate iniţial ţināndu-se cont de
această cerinţă de interoperabilitate);
-
utilizarea ontologiilor şi regulilor pentru a permite
raţionamentul automat asupra conţinutului surselor;
-
utilizarea şi īmbunătăţirea standardelor şi tehnologiilor
existente;
-
crearea resurselor de limbaj natural care să faciliteze
prelucrarea eficientă, bazată pe conţinut a documentelor.
Resursele şi instrumentele specifice limbii vor fi dezvoltate
conform celor mai bune practici internaţionale, pentru o uşoară
integrare īn mediul multilingv standardizat de prelucrare;
-
dezvoltarea unei clasificări bazate pe conţinut a documentelor,
conform ontologiilor specifice domeniilor, şi generarea, pentru
documentele astfel clasificate, a meta-datelor, conform
ultimelor standarde ale Web-ului Semantic;
-
dezvoltarea de servicii sofisticate pentru sistemele de
īntrebare-răspuns pentru limbile naturale (limba romānă) care
privesc conţinutul documentelor, rezumarea, asistenţa
inteligentă īn citirea documentelor īn limbi străine etc.
Caracteristicile
sistemului
·Deoarece
construirea unei aplicaţii complete de Semantic Web cu tehnologia actuală
este extrem de laborioasă şi costisitoare, īn proiectul de fata ne propunem
construirea unui mediu inteligent de dezvoltare a aplicaţiilor de
acest tip. Un astfel de mediu va pune accentul pe utilizarea mecanismelor
de raţionament īn prelucrarea cunoştinţelor domeniului aplicaţiei (ontologii,
adnotări, reguli, restricţii) şi va utiliza tehnici de invăţare automată
pentru simplificarea majorităţii aspectelor şi etapelor de dezvoltare ale
unei aplicaţii de Semantic Web.
Sistemul va oferi atāt componente necesare pentru designul unei aplicaţii
SW, cāt şi o componentă de interogare care preia o cere utilizator şi
accesează numai sursele Web relevante utilizănd cunoştinţele specifice
domeniului.
Proiectul işi propune abordarea problemelor legate dSemantic Web intr-un
cadru cāt mai complet. Proiectul ROTEL va demonstra avantajele
combinării cunoştinţelor de domeniu (reprezentate ca ontologii formale,
conforme principiilor susţinute de Semantic Web Services Language Committee)
şi cunoştinţelor lingvistice (reprezentate prin ontologii lexicale şi
diferite modele de limbă). Această demonstraţie se va baza pe tehnici de
Regăsire a Informaţiei Semantice şi de Extragere a Cunoştinţelor
din documente.
Facilităţi legate de design-ul aplicaţiei
-
crearea şi actualizarea ontologiilor lexicale
şi de domeniu;
-
stabilirea regulilor pentru descrierea
semanticii operaţionale a ontologiei;
-
dezvoltarea unui sistem care să genereze
adnotări semantice ale documentelor
-
dezvoltarea unui sistem de extragere de
termeni şi de clasificare tematică pentru o mulţime īnchisă (dar
extensibilă) de domenii suportate de ontologiile locale;
-
dezvoltarea unui sistem de aliniere pentru
dezambiguizarea termenilor dintr-un text şi pentru echivalarea
lor cu elemente ale ontologiilor folosite;
-
o interfaţă grafică pentru asistarea
inginerului de cunoştinţe īn procesul descrierii regulilor de
corespondenţă dintre formatele locale ale surselor şi ontologia
domeniului;
-
o interfaţă grafică care să asiste inginerul
de cunostinţe īn procesul de construire a «wrapper»-elor
-
folosirea instrumentelor de adnotare pentru
paginile HTML şi pentru serviciile Web;
-
utilizarea unor metode de īnvaţare automată
pentru a obţine cunostinţe despre schema sursei de informaţie şi
despre conţinutul acesteia (tipurile şi domeniile datelor,
restricţii de cardinalitate, diverse statistici legate de
numărul de "īnregistrări" şi timpul de acces la surse,
cunostinţe despre conţinutul semantic al surselor, legăturile
dintre surse, suprapuneri īntre surse, completitudinea surselor,
etc)
Componenta de interogare «inteligentă»
-
arhitectura bazată pe mediere şi planificarea
interogărilor pentru tratarea interogărilor semantice
-
utilizarea informaţiilor despre conţinutul şi
capabilităţile surselor la planificarea interogărilor īn scopul
realizării accesului eficient la surse
-
tratarea problemei compunerii serviciilor Web
la planificarea interogărilor
-
o interfaţă grafică care să asiste
utilizatorul aplicaţiei īn construirea simplă a interogărilor
-
o interfaţă īn limbaj natural care să permită
utilizatorului să obţină răspunsuri la anumite īntrebări,
exprimate īn limba romānă, legate de documentele dintr-un anumit
domeniu tematic;
-
un sistem de rezumare a documentelor, care să
furnizeze rezumate de lungime controlată a documentelor
relevante;
-
prezentarea rezultatelor interogării īn
format navigabil.
|
|
|
|