Comisia de atestare
Comisia de acreditare
Comisiile de experţi
Dispoziţii, instrucţiuni
Acte normative
Nomenclator
Instituţii
Consilii
Seminare
Teze
Conducători de doctorat
Deţinători de grad
Doctoranzi
Postdoctoranzi
CNAA logo

 română | русский | english

CNAA / Teze / 2008 / mai /

Analiza computaţională a corespondenţei de afaceri


Autor: Victoria Maxim
Gradul:doctor în ştiinţe fizico-matematice
Specialitatea: 01.05.04 - Modelare matematică, metode matematice, produse program
Anul:2008
Conducători ştiinţifici: Anatol Popescu
doctor habilitat, profesor universitar, Universitatea Tehnică a Moldovei
Anatol Ciobanu
doctor habilitat, profesor universitar, Universitatea de Stat din Moldova
Instituţia: Institutul de Matematică şi Informatică
CSS: DH 01-01.05.04-27.03.08
Institutul de Matematică şi Informatică

Statut

Teza a fost susţinută pe 23 mai 2008 în CSS
şi aprobată de CNAA pe 19 iunie 2008

Autoreferat

Adobe PDF document0.79 Mb / în română

Teza

CZU 004.912

Adobe PDF document 2.12 Mb / în română
220 pagini

Cuvinte Cheie

Achiziţia termenilor, Adnotare morfologică automată, , Analiza automată, Aspect conceptual ontologic, Codificare morfologică, Concepte de business, Corespondenţa de afaceri, Corpus paralel bilingv, Dicţionar bilingv de termeni de afaceri, Instruirea automată, Izomorfisme, Limbaj comercial, Limbaj de programare Perl, Limbaj de programare Delphi, Memorie de traducere, Modelare lingvistică, Parsing, Procesarea Limbajului Natural, Reguli de transformare, Reprezentări formale ale frazei, Reprezentări semantice, Resurse lingvistice computaţionale, Reţea semantică, Traducerea Automată, Unitate terminologică

Adnotare

Lucrarea de faţă reprezintă un studiu efectuat pentru analiza automată a textelor scrisorilor de afaceri cu scopul de a elabora tehnologia şi resursele lingvistice computaţionale necesare pentru traducerea asistată de computer a corespondenţei de afaceri engleze-române. Este realizată în baza unui corpus paralel bilingv englez - român de scrisori de afaceri (42 300 cuvinte) şi a materialului faptic din dicţionare.

Teza se află la intersecţia a două ştiinţe - lingvistica şi informatica. Din acest motiv abordarea problemelor s-a efectuat şi prin metoda sinergetică, adică am recurs la analogii, sinteze şi corelarea rezultatelor disparate.

Ne-am propus o analiză a Limbajului Comercial la nivel morfologic, sintactic, semantic şi al vocabularului, aducând argumente morfo-lexicale, sintactice, semantice şi stilistice în favoarea existenţei unui asemenea limbaj specializat.

A fost specificat domeniul de Instruire Automată Supervizată (Supervised Machine Learning) şi cel al Programării Orientate pe Obiect (Object Oriented Programing), algoritmii căreia au servit la alcătuirea unei ontologii sumare a termenilor de afaceri. Au fost abordate probleme de sintaxă funcţională şi categorială, generativ – transformaţională şi au fost prezentate abordări formale ale frazei. Pentru achiziţionarea cât mai rapidă a unui anumit tip de informaţie este nevoie de o reprezentare semantică şi de calculul sensului unui enunţ. Semantica computaţională se ocupă anume de aceste probleme, utilizând logica propoziţiilor şi calculul predicatelor.

Sunt prezentate cercetările efectuate pe corpusul paralel bilingv român-englez de texte de scrisori de afaceri şi rezultatele analizei automate a acestui corpus. Se propune o analiză a limbajului comercial sub aspect conceptual-ontologic şi terminologic, se expun principiile şi metodologia de traducere asistată de computer a scrisorilor comerciale. Au fost extrase 1831 de perechi de unităţi terminologice, iar pentru termenii complecşi au fost elaborate 43 modele de reguli de transformare.

În baza resurselor lingvistice computaţionale elaborate a fost creat un produs soft BusLet Translator care efectuează traducerea asistată de computer a scrisorilor comerciale cu ajutorul Programării Orientate pe Obiect, al memoriei de traducere şi al dicţionarului bilingv englez-român de termeni de afaceri.

Cercetările efectuate indică aspectul de valoare a cadrului conceptual, în urma căruia au fost obţinute rezultate ştiinţifice noi, a fost reliefat primatul lucrării pentru contribuţiile ulterioare

ştiinţifice şi didactice, care prefigurează soluţii concrete la predarea cursului teoretico- practic universitar – Lingvistica Computaţională.

Cuprins


CAPITOLUL I Caracteristica limbajului comercial
  • 1.1. Limbaj şi comunicare.
  • 1.2. Configuraţia stilistică a limbii.
  • 1.3. Structura Limbajului Comercial.
  • 1.4. Argumente în favoarea existenţei aşa-numitului Limbaj Comercial
  • 1.5. Elementele componente ale scrisorii de afaceri.
  • Concluzii la capitolul I.

CAPITOLUL II Analiza computerizată a textelor
  • 2.1. Consideraţii generale.
  • 2.2. Lingvistica şi Procesarea Limbajului Natural.
  • 2.3. Cercetări şi realizări româneşti în domeniul Procesării Limbajului Natural.
  • 2.4. Analiza automată a textelor în limbaj natural.
  • 2.4.1. Generalităţi.
  • 2.4.2. Cunoştinţe despre limbă necesare pentru analiza textelor şi metode pentru analiză.
  • 2.5. Arhitectura sistemului de Procesare a Limbajului Natural
  • 2.6. Probleme de sintaxă.
  • 2.6.1. Sintaxa funcţională şi categorială. Analiza sintagmatică.
  • 2.6.2. Sintaxa generativ-transformaţională.
  • 2.6.3. Reprezentări formale ale frazei.
  • 2.7. Parsingul.
  • 2.8. Probleme de semantică.
  • 2.9. Probleme de pragmatică.
  • 2.10. Probleme de discurs.
  • 2.11. Traducerea automată.
  • Concluzii la capitolul II.

CAPITOLUL III Analiza computerizată a textelor scrisorilor de afaceri
  • 3.1. Analiza Limbajului Comercial sub aspect conceptual-ontologic.
  • 3.2. Analiza Limbajului Comercial sub aspect terminologic.
  • 3.2.1. Noţiune de termen.
  • 3.2.2. Extragerea termenilor şi Procesarea Limbajului Natural.
  • 3.2.3. Pregătirea corpusului de referinţă.
  • 3.2.4. POS tagging.
  • 3.3. Analiza frecvenţei cuvintelor din textele scrisorilor româneşti.
  • 3.4. Terminografia şi achiziţia termenilor.
  • 3.5. Materiale şi metode.
  • 3.6. Categorii de reguli.
  • Concluzii la capitolul III.

CAPITOLUL IV Descrierea programului elaborat
  • 4.1. Memoria de traducere.
  • 4.2. Descrierea algoritmului şi a programului elaborat.
  • 4.2.1. Segmentarea.
  • 4.2.2. Lucrul cu Memoria de Traducere.
  • 4.2.3. Alte facilităţi. . 103.
  • 4.2.4. Procesul de traducere.
  • 4.3. Descrierea algoritmului şi structura programului.