ROTEL


Home
Consortiul
Etape
Publicatii
Cautare
Discutii
Contact

ROTEL - Sisteme inteligente pentru Webul semantic, bazate pe logica ontologiilor si tehnologiile limbajului. Aplicaţii pentru limba romana

 

Principalul scop al ROTEL este proiectarea, implementarea şi evaluarea unei platforme inteligente, bazate pe conţinut, pentru a asista inginerul de cunoştinţe īn construirea unei aplicaţii pentru Web-ul Semantic care să permită utilizarea limbii romāne īn mediul multilingv al Web-ului.
      

      Obiective  

  • extragerea inteligentă a informaţiei conţinute īn surse Web (structurate, semi-structurate, text);

  • integrarea şi interogarea bazate pe semantică a surselor Web disparate (care nu au fost dezvoltate iniţial ţināndu-se cont de această cerinţă de interoperabilitate);

  • utilizarea ontologiilor şi regulilor pentru a permite raţionamentul automat asupra conţinutului surselor;

  • utilizarea şi īmbunătăţirea standardelor şi tehnologiilor existente;

  • crearea resurselor de limbaj natural care să faciliteze prelucrarea eficientă, bazată pe conţinut a documentelor. Resursele şi instrumentele specifice limbii vor fi dezvoltate conform celor mai bune practici internaţionale, pentru o uşoară integrare īn mediul multilingv standardizat de prelucrare;

  • dezvoltarea unei clasificări bazate pe conţinut a documentelor, conform ontologiilor specifice domeniilor, şi generarea, pentru documentele astfel clasificate, a meta-datelor, conform ultimelor standarde ale Web-ului Semantic;

  • dezvoltarea de servicii sofisticate pentru sistemele de īntrebare-răspuns pentru limbile naturale (limba romānă) care privesc conţinutul documentelor, rezumarea, asistenţa inteligentă īn citirea documentelor īn limbi străine etc.
     

Ö

      Caracteristicile sistemului

 

·Deoarece construirea unei aplicaţii complete de Semantic Web cu tehnologia actuală este extrem de laborioasă şi costisitoare, īn proiectul de fata ne propunem construirea unui mediu inteligent de dezvoltare a aplicaţiilor de acest tip. Un astfel de mediu va pune accentul pe utilizarea mecanismelor de raţionament īn prelucrarea cunoştinţelor domeniului aplicaţiei (ontologii, adnotări, reguli, restricţii) şi va utiliza tehnici de invăţare automată pentru simplificarea majorităţii aspectelor şi etapelor de dezvoltare ale unei aplicaţii de Semantic Web.


Sistemul va oferi atāt componente necesare pentru designul unei aplicaţii SW, cāt şi o componentă de interogare care preia o cere utilizator şi accesează numai sursele Web relevante utilizănd cunoştinţele specifice domeniului.

Proiectul işi propune abordarea problemelor legate dSemantic Web intr-un cadru cāt mai complet. Proiectul ROTEL va demonstra avantajele combinării cunoştinţelor de domeniu (reprezentate ca ontologii formale, conforme principiilor susţinute de Semantic Web Services Language Committee) şi cunoştinţelor lingvistice (reprezentate prin ontologii lexicale şi diferite modele de limbă). Această demonstraţie se va baza pe tehnici de Regăsire a Informaţiei Semantice şi de Extragere a Cunoştinţelor din documente.


Facilităţi legate de design-ul aplicaţiei

  • crearea şi actualizarea ontologiilor lexicale şi de domeniu;

  • stabilirea regulilor pentru descrierea semanticii operaţionale a ontologiei;

  • dezvoltarea unui sistem care să genereze adnotări semantice ale documentelor

  • dezvoltarea unui sistem de extragere de termeni şi de clasificare tematică pentru o mulţime īnchisă (dar extensibilă) de domenii suportate de ontologiile locale;

  • dezvoltarea unui sistem de aliniere pentru dezambiguizarea termenilor dintr-un text şi pentru echivalarea lor cu elemente ale ontologiilor folosite;

  • o interfaţă grafică pentru asistarea inginerului de cunoştinţe īn procesul descrierii regulilor de corespondenţă dintre formatele locale ale surselor şi ontologia domeniului;

  • o interfaţă grafică care să asiste inginerul de cunostinţe īn procesul de construire a «wrapper»-elor

  • folosirea instrumentelor de adnotare pentru paginile HTML şi pentru serviciile Web;

  • utilizarea unor metode de īnvaţare automată pentru a obţine cunostinţe despre schema sursei de informaţie şi despre conţinutul acesteia (tipurile şi domeniile datelor, restricţii de cardinalitate, diverse statistici legate de numărul de "īnregistrări" şi timpul de acces la surse, cunostinţe despre conţinutul semantic al surselor, legăturile dintre surse, suprapuneri īntre surse, completitudinea surselor, etc)

Componenta de interogare «inteligentă»

  • arhitectura bazată pe mediere şi planificarea interogărilor pentru tratarea interogărilor semantice

  • utilizarea informaţiilor despre conţinutul şi capabilităţile surselor la planificarea interogărilor īn scopul realizării accesului eficient la surse

  • tratarea problemei compunerii serviciilor Web la planificarea interogărilor

  • o interfaţă grafică care să asiste utilizatorul aplicaţiei īn construirea simplă a interogărilor

  • o interfaţă īn limbaj natural care să permită utilizatorului să obţină răspunsuri la anumite īntrebări, exprimate īn limba romānă, legate de documentele dintr-un anumit domeniu tematic;

  • un sistem de rezumare a documentelor, care să furnizeze rezumate de lungime controlată a documentelor relevante;

  • prezentarea rezultatelor interogării īn format navigabil.
     

 
 
 

Home | Consortiul | Etape | Publicatii | Cautare | Discutii | Contact

 Copyright ICI(R).
Last updated: 01/30/07.