Matematičke metode u poredbenom jezikoslovlju. Povijest primjene matematičkih metoda u lingvistici


           Od vremena kada je Baudouin de Courtenay davne 1904. godine prvi izrazio mišljenje o potrebi korištenja matematičkih metoda u lingvistici ( Kondrashov N.A., 1979, 170), prošlo je dosta vremena prije nego što su počeli prvi ozbiljniji pokušaji njihove uporabe. Ali postupno su matematičke metode u lingvistici pronašle široku paletu primjena. Čak se pojavila cijela grana lingvistike - matematička lingvistika ( Lesokhin M.M., 1982 i drugi). U fonetici i sintaksi upotreba Markovljevih procesa poznatih u teoriji vjerojatnosti mnogo obećava. U povijesnom i komparativnom jezikoslovlju, koje nas najviše zanima, razvijaju se metode glotokronologije, od kojih je jednu predložio Maurice Swadesh (Maurice Swadesh, 1960-1). Pretpostavio je da određeni dio osnovnog vokabulara svih jezika čini određenu leksičku jezgru, koja je relativno stabilna, jer se mijenja konstantnom, ali vrlo sporom brzinom, otprilike na isti način kao radioaktivni raspad. Ako znamo postotak riječi koje su se u nekom jeziku očuvale određeno vrijeme, tada možemo izračunati konstantu brzine promjena u leksičkom sastavu, koja se, iako konstantna vrijednost, može malo razlikovati za različite jezike i različite razdoblja njihova razvoja. Sastavio je popis leksičke jezgre riječi, prvo u količini od 100, a kasnije 200 riječi, te je, uspoređujući postotak riječi u toj jezgri sačuvanih u parovima blisko srodnih jezika, pokušao izračunati vrijeme koji je prošao od trenutka kada su se ovi jezici odvojili jedan od drugog. Međutim, tempo jezičnih promjena zapravo se uvelike razlikuje među jezicima i razdobljima. Prema Vl.Georgievu, "pod primitivnim sustavom proces promjena u društvenom životu iu jeziku događa se to sporije što više prodiremo u dubinu tisućljeća: za najmanje promjene nisu bila potrebna stoljeća, nego tisućljeća" ( Georgiev Vl., 1958, 243). Stoga je vjerojatno da su rezultati izračuna koje je dobio Swadesh proturječili očitim činjenicama, a znanstvenik je pokušao poboljšati svoju metodu, ali bezuspješno ( Swadesh Morris, 1960-2). Njegova je ideja svakako bila vrlo zanimljiva, ali njezina provedba bila je nemoguća zbog teškoća određivanja konstante brzine promjena u leksičkoj jezgri, te temeljne nemogućnosti sastavljanja popisa riječi za tu jezgru koji bi mogao biti univerzalan za sve jezike svijeta bez iznimke. Nemogućnost rješavanja ovih problema dokazao je Harry Heuer ( Hoyer Harry, 1960) i V.A. Zvegintsev, koji je napisao:


           Kada M. Swadesh pokušava sastaviti "eksperimentalni popis" prikladan za sve jezike i formulirati univerzalna pravila za njegovu kompilaciju, on sebi postavlja zadatak koji se zapravo ne može dovršiti" (Zvegintsev V.A., 1960, 13) .


           Također zanimljiv pokušaj utvrđivanja starosti pojedinih jezika napravili su M.V. Arapov i M.M. Herts. Postavili su si zadatak “izgraditi matematički model promjena u rječniku i na temelju tog modela teorijski dobiti odnos između vremena pojavljivanja riječi i njezinog ranga u frekvencijskom rječniku” ( Arapov M.V., Herts M.M., 1974, 3). Dobivši ovaj model, nadali su se izračunati starost pojedinih srodnih jezika. Kako bi to učinili, predložili su empirijsku formulu koja opisuje vjerojatnost pojavljivanja riječi u odabranom trenutku u vremenu. Ključno mjesto u ovoj formuli zauzima određena konstanta, koja se sama može mijenjati za različite kronološke dijelove i za različite jezike, ali brzina razvoja jezika u različitim razdobljima, kao što je već navedeno, može biti vrlo različita, a sada ne možemo imati najmanje informacije o zastupljenosti ovih značajki. Autori su objektivno ocijenili svoju metodu, napominjući da su samo željeli demonstrirati njezine mogućnosti, jer je za izračun konstante potrebno imati frekvencijske rječnike sastavljene prema jedinstvenoj metodologiji, a povijesnu leksikografiju treba razviti do te mjere da mogao omogućiti bilježenje trenutka pojave nove riječi s točnošću barem do stoljeća. "Budući da oba ova zahtjeva nisu ispunjena... podaci o stopi promjene pojedinih jezika nisu usporedivi" ( Arapov M.V., Herts M.M., 1974, 56). Stoga metoda još uvijek čeka svoju implementaciju.

           Prvi pokušaj kvantificiranja stupnja srodstva među jezicima napravio je 1927. godine J. Chekanovsky. Pokušao je upotrijebiti matematički kriterij neovisnosti za procjenu sličnosti dviju asocijacija, koji je u praksu antropoloških istraživanja uveo E. B. Taylor 1888. Koristeći ovu metodu, poljski je istraživač odražavao stupanj srodstva slavenskih jezika, a kasnije i nekih Indoeuropski jezici ( Czekanowski Jan, 1957, 71). Metoda nije prihvaćena od strane većine lingvista zbog proizvoljnog odabira značajki i potrebe da se neke od njih dvostruko broje ( Popowska-Taborska Hanna, 1991, 34). Postoje i druge metode za procjenu sličnosti asocijacija koje uzimaju u obzir prisutnost određene značajke u jednom od dva objekta koja je odsutna u drugom objektu.

           Međutim, za proučavanje odnosa jezika usporedbom vokabulara, oni su neprihvatljivi, jer odsutnost značajke u stvarnosti može značiti samo njezinu odsutnost na našem raspolaganju, ali zapravo je mogla postojati prije ili postoji sada, ali ga znanstveni istraživači nisu zabilježili. U arheologiji i antropologiji slične metode mogu naći primjenu, jer se tamo radi o materijalnim objektima koji dovoljno daju predodžbu o njihovom izvornom obliku, ali u povijesnoj lingvistici nikada ne možemo biti sigurni u odsutnost bilo kakvih karakteristika u predmetu istraživanja u dalekoj prošlosti. Stoga u lingvistici postoji pravilo: “Samo pozitivne činjenice imaju dokaznu vrijednost.”

           Kasnije je ideje Czekanovskog u određenom smislu nastavio još jedan poljski istraživač V. Manchak, koji se pridržava temeljnog koncepta: postoji određena veza između srodstva jezika i njihovog geografskog položaja ( Mańczak Witold, 1981, 138). Uspoređuje broj zajedničkih riječi gotskog, starobugarskog i litavskog jezika, koristeći se isključivo biblijskim tekstovima napisanim na tim jezicima, pretpostavljajući da su vrlo bliski germanskim, slavenskim i baltičkim jezicima, na temelju njegove drugo načelo: prebrojavanje onoga što se nalazi u gramatikama i rječnicima često može dovesti do lažnih zaključaka, dok prebrojavanje onoga što je sadržano u tekstovima omogućuje otkrivanje istine. Nije ovdje mjesto za razmatranje njegovih lingvističkih načela, tim više što je Popowska-Taborska to već učinila ( Popowska-Taborska Hanna, 1991., 35-35, 94-97), no matematička strana istraživanja zahtijeva određene komentare. Zemljopisni položaj prapostojbine Slavena općenito je nemoguće povezati na temelju dobivenih podataka iz triju jezika, jer je, slikovito rečeno, u jednoj jednadžbi više od jedne nepoznanice. Nakon što smo čak dobili pravi dijagram položaja triju jezika u ravnini, moramo točno znati mjesto formiranja barem jednog od tih jezika i biti sigurni da područje jednog od preostalih jezika leži u određenom smjeru od njega. Osim toga, također je potrebno nekako odrediti vrijeme, jer bi govornici sva tri jezika tijekom vremena mogli više puta promijeniti mjesta svojih naselja i naći se u različitim položajima jedni prema drugima. Pridruživanje proučavanju odnosa ovih jezika s latinskim, kao što to čini Manchak, također malo mijenja, jer također nema razloga pretpostaviti a priori da su germanski, slavenski i baltički jezici nastali tijekom postojanja rimskog Carstvo.

matematička disciplina čiji je predmet razvoj formalnog aparata za opisivanje strukture prirodnih i nekih umjetnih jezika. Nastao 50-ih godina. 20. stoljeće; jedan od glavnih poticaja za nastanak M. l. poslužilo je kao prijeka potreba u lingvistici da razjasni njezine temeljne pojmove. Metode M. l. imaju mnogo zajedničkog s metodama matematičke logike - matematičke discipline koja proučava strukturu matematičkog zaključivanja - a posebno s odjeljcima kao što su teorija algoritama i teorija automata. Naširoko se koristi u M. l. također algebarske metode. M. l. razvija se u bliskoj interakciji s lingvistikom. Ponekad se izraz "M. l." također se koristi za označavanje bilo kojeg lingvističkog istraživanja u kojem se koristi neka vrsta matematičkog aparata.

Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja seže do F. de Saussurea, čije se funkcioniranje očituje u govornoj aktivnosti njegovih govornika; njegov rezultat su "ispravni tekstovi" - nizovi govornih jedinica koje slijede određene obrasce, od kojih mnogi dopuštaju matematički opis. Razvoj i proučavanje metoda matematičkog opisa ispravnih tekstova (prvenstveno rečenica) čini sadržaj jednog od dijelova matematičke literature. - teorije o načinima opisivanja sintaktičke strukture. Da bismo opisali strukturu rečenice - točnije, njezinu sintaktičku strukturu - u njoj se može istaknuti ili komponente- skupine riječi koje funkcioniraju kao cjelovite sintaktičke jedinice ili za svaku riječ označite one riječi koje su joj neposredno podređene (ako postoje). Dakle, u rečenici "Kočijaš sjedi na gredi" (A.S. Puškin), kada se opisuje prema 1. metodi, komponente će biti cijela rečenica P, svaka njezina pojedinačna riječ i skupina riječi A = sjedi na gredi greda i B = na gredi (vidi sliku 1; strelice označavaju "izravno pričvršćivanje"); opis prema 2. metodi daje dijagram prikazan na sl. 2. Matematički objekti koji pritom nastaju nazivaju se sustav komponenti(1. metoda) i sintaktičko subordinacijsko stablo(2. metoda).

Preciznije, sustav komponenata je skup rečeničnih segmenata koji kao elemente sadrži cijelu rečenicu i sva pojavljivanja riječi u toj rečenici (“jednorječni segmenti”) i ima svojstvo da svaka dva segmenta uključena u njega ili ne sijeku se ili je jedan od njih sadržan u drugom; Sintaktičko subordinacijsko stablo, ili jednostavno subordinacijsko stablo, je stablo čiji su brojni čvorovi mnoga pojavljivanja riječi u rečenici. drvo u matematici se naziva skup, između elemenata kojih se nazivaju čvorovi- uspostavlja se binarna relacija - tzv odnos podređenosti i grafički su prikazani strelicama koje idu od podređenih čvorova do podređenih - tako da: 1) među čvorovima postoji točno jedan - naziva se korijen, - nije podređen nijednom čvoru; 2) svaki od preostalih čvorova je podređen točno jednom čvoru; 3) nemoguće je, nakon odlaska iz bilo kojeg čvora duž strelica, vratiti se na isti čvor. Čvorovi stabla subordinacije su pojavljivanja riječi u rečenicama. Kada se grafički prikaže, sustav komponenti (kao na slici 1) također poprima izgled stabla ( stablo komponenti). Često se naziva subordinacijsko stablo ili sustav komponenti izgrađenih za rečenicu sintaktička struktura u obliku subordinacijskog stabla (sustava komponenti). Sustavi komponenti koriste se prvenstveno u opisima jezika s krutim redoslijedom riječi, stabla subordinacije - u opisima jezika sa slobodnim redoslijedom riječi (osobito ruski), formalno, za svaku (ne prekratku) rečenicu, mogu se konstruirati mnoge različite sintaktičke strukture bilo koje od dvije vrste, ali među njima samo je jedna ili više njih ispravna. Korijen ispravnog stabla subordinacije obično je predikat. Rečenica koja ima više od jednog ispravnog sintaktičkog ustrojstva (iste vrste) naziva se sintaksički homonim; Različitim značenjima rečenice u pravilu odgovaraju različite sintaktičke strukture. Na primjer, rečenica "Školarci iz Rzheva otišli su u Torzhok" dopušta dva ispravna stabla podređenosti (sl. 3, a, b); prvi od njih odgovara značenju "Rževski školarci su išli (ne nužno iz Rževa) u Toržok", drugi - "Školarci (ne nužno Ržev) su išli iz Rževa u Toržok."

U ruskom i nizu drugih jezika, subordinacijsko stablo rečenica "poslovnog stila" obično je podređeno zakon projektivnosti, koja se sastoji u tome, da se sve strelice mogu povući preko crte, na kojoj je rečenica napisana, i to tako, da se nijedna od njih dvije ne sijeku i korijen neće ležati ni pod jednom strelicom. U jeziku beletristike, osobito u poeziji, odstupanja od zakona projektivnosti su dopuštena i najčešće služe stvaranju određenog umjetničkog učinka. Tako u rečenici “Prijatelji krvave davnine narodnog rata” (Puškin) neprojektivnost dovodi do emfatičnog isticanja riječi “narodni” i ujedno kao da usporava govor, stvarajući tako dojam stanovitog ushićenja i svečanosti. Postoje i druge formalne značajke stabala subordinacije koje se mogu koristiti za karakterizaciju stila. Na primjer, najveći broj ugniježđenih strelica služi kao mjera "sintaktičke glomaznosti" rečenice (vidi sliku 4).

Radi što adekvatnijeg opisa strukture rečenice sastavnice se obično označavaju simbolima gramatičkih kategorija (“imenski izraz”, “prijelazna glagolska skupina” itd.), a strelice subordinacijskog stabla označene su simbolima sintaktičke odnose (“predikativ”, “definitiv” itd. .).

Aparat subordinacijskih stabala i sustava komponenti također se koristi za predstavljanje duboke sintaktičke strukture rečenice, koja tvori međurazinu između semantičke i obične sintaktičke strukture (potonja se često naziva površinskom sintaktičkom).

Savršeniji prikaz sintaktičke strukture rečenice (zahtijeva, međutim, složeniji matematički aparat) daje sustavi sintaktičkih skupina, koji uključuju i fraze i sintaktičke veze, i to ne samo između riječi, već i između fraza. Sustavi sintaktičkih grupa omogućuju kombiniranje strogosti formalnog opisa strukture rečenice s fleksibilnošću svojstvenom tradicionalnim, neformalnim opisima. Subordinacijsko stablo i sastavni sustavi ekstremni su posebni slučajevi sustava sintaktičkih skupina.

Drugi dio M. l. koji u njemu zauzima središnje mjesto je teorija formalnih gramatika, koji je započeo radovima N. Chomskog. Proučava načine opisivanja obrazaca koji karakteriziraju ne jedan tekst, već cijeli skup točnih tekstova određenog jezika. Ovi obrasci opisani su pomoću formalna gramatika- apstraktni “mehanizam” koji omogućuje, korištenjem jedinstvenog postupka, dobivanje točnih tekstova određenog jezika zajedno s opisom njihove strukture. Najčešće korištena vrsta formalne gramatike je generativna gramatika, ili Chomskyjeva gramatika, koja je uređeni sustav G = ⟨ V, W, P, R ⟩, gdje su V i W disjunktni konačni skupovi, tzv. glavni, ili terminal, I pomoćni, ili neterminalni, abecede(njihovi elementi se nazivaju glavnim ili terminalnim i pomoćnim ili neterminalnim, simboli), P - element W, tzv početni karakter, a R je konačan skup pravila oblika φ → ψ, gdje su φ i ψ lanci (konačni nizovi) glavnih i pomoćnih simbola. Ako je φ → ψ pravilo gramatike G i ω 1, ω 2 su lanci glavnih i pomoćnih simbola, kažu da je lanac ω 1 ψω 2 izravno zaključiti u G od ω 1 φω 2 . Ako su ξ 0, ξ 1, ..., ξ n lanci i za svaki i = 1, ..., n lanac ξ i je direktno deducibilan iz ξ i−1, kažemo da je ξ n zaključiv u G od ξ 0 . Skup onih lanaca osnovnih simbola koji se mogu izvesti u Γ iz njegovog početnog simbola naziva se jezik generiran gramatikom G, a označava se s L(G). Ako sva pravila Γ imaju oblik η 1 Aη 2 → η 1 ωη 2 , tada se Γ naziva gramatika sastavnica(ili izravno komponente), skraćeno NS- gramatika; ako u svakom pravilu lanca postoje η 1 i η 2 ( desni i lijevi konteksti) prazne, tada se poziva gramatika bez konteksta(ili bez konteksta), skraćeno B- gramatika(ili KS- gramatika). U najčešćem lingvističkom tumačenju glavni simboli su riječi, pomoćni simboli su simboli gramatičkih kategorija, početni simbol je simbol kategorije "rečenica"; u ovom slučaju, jezik generiran gramatikom tumači se kao skup svih gramatički ispravnih rečenica danog prirodnog jezika. U NN gramatici, izlaz rečenice daje stablo konstituenata, u kojem se svaki konstituent sastoji od riječi "izvedenih" iz jednog pomoćnog simbola, tako da je svakom konstituentu dana njegova gramatička kategorija. Dakle, ako gramatika između ostalih ima pravila P → S x, y, im, V y → V i y O, O → S x, y, rečenica, V i y → sjedi, S muž, jedinica, im → na , kočijaš, S muž, jednina, rečenica. → zračenje, tada rečenica “Vozač sjedi na zračenju” ima zaključak prikazan na sl. 5, gdje strelice idu od lijevih dijelova primijenjenih pravila do elemenata desnih dijelova. Sustav komponenti koji odgovara ovom zaključku podudara se s onim prikazanim na Sl. 1. Moguća su i druga tumačenja: npr. glavni simboli mogu se tumačiti kao morfi, pomoćni simboli kao simboli vrsta morfa i dopuštenih nizova morfa, početni simbol kao simbol tipa "oblik riječi", a jezik generiran gramatikom kao skup pravilnih oblika riječi (morfološka interpretacija); Također se koriste morfonološka i fonološka tumačenja. U stvarnim opisima jezika obično se koriste "višerazinske" gramatike koje sadrže sekvencijalno radna sintaktička, morfološka i morfološko-fonološka pravila.

Druga važna vrsta formalne gramatike je gramatika dominacije, koji generira mnogo lanaca, obično interpretiranih kao rečenice zajedno s njihovim sintaktičkim strukturama u obliku podređenih stabala. Gramatika sintaktičkih skupina generira mnoge rečenice zajedno s njihovim sintaktičkim strukturama, koje imaju oblik sustava sintaktičkih skupina. Postoje i razni koncepti transformacijska gramatika (gramatike stabla), koji ne služi za generiranje rečenica, već za transformaciju stabala, tumačenih kao stabla subordinacije ili stabla komponenti. Primjer je Δ- gramatika- sustav pravila za transformaciju stabala, tumačenih kao "čista" rečenična subordinacijska stabla, tj. subordinacijska stabla bez linearnog reda riječi.

Oni stoje odvojeno Montagueova gramatika, koji služi za istodobno opisivanje sintaktičke i semantičke strukture rečenice; koriste složeni matematički i logički aparat (tzv intenzionalna logika).

Formalne gramatike se koriste za opisivanje ne samo prirodnih nego i umjetnih jezika, posebno programskih jezika.

U M. l. također se razvijaju analitički modeli jezika, u kojima se na temelju određenih podataka o govoru koji se smatraju poznatima izrađuju formalne konstrukcije čiji je rezultat opis pojedinih aspekata strukture jezika. Ovi modeli obično koriste jednostavan matematički aparat - jednostavne koncepte teorije skupova i algebre; Zbog toga se ponekad nazivaju analitički modeli jezika teorijski skup. U analitičkim modelima najjednostavnijeg tipa početni podatak je skup točnih rečenica i sustav okruženje- skupovi "riječi" koji pripadaju jednom leksemu (na primjer, (kuća, kuća, kuća, kuća, kuća, kuća, kuća, kuća, kuća, kuća)). Najjednostavniji izvedeni koncept u takvim modelima je zamjenjivost: riječ a zamjenjiva riječju b, ako je svaka točna rečenica koja sadrži pojavljivanje riječi a, ostaje točna kada se ovo pojavljivanje zamijeni pojavljivanjem riječi b. Ako A zamjenjivo po b I b na a, to kažu a I b zamjenjivi. (Na primjer, u ruskom je riječ "plava" zamijenjena riječju "goluboj"; riječi "sinego" i "golubogo" su međusobno zamjenjive.) Klasa riječi koje su međusobno zamjenjive naziva se obitelj. Iz susjedstava i obitelji može se izvesti niz drugih jezično značajnih klasifikacija riječi, od kojih jedna otprilike odgovara tradicionalnim dijelovima govornog sustava. U drugoj vrsti analitičkih modela, umjesto skupa ispravnih rečenica, koristi se odnos potencijalne podređenosti između riječi, što znači sposobnost jedne od njih da podredi drugu u ispravnim rečenicama. U takvim je modelima moguće dobiti, posebno, formalne definicije niza tradicionalnih gramatičkih kategorija - na primjer, formalnu definiciju padeža imenice, što je postupak koji vam omogućuje rekonstrukciju padežnog sustava jezika, znajući samo odnos potencijalne subordinacije, sustav susjedstva i skup riječi koje su oblici imenica.

Analitički jezični modeli koriste jednostavne koncepte iz teorije skupova i algebre. Blizu analitičkih modela jezika modeli dešifriranja- postupci koji omogućuju da se iz dovoljno velikog korpusa tekstova na nepoznatom jeziku bez ikakvih prethodnih informacija o njemu dobije niz podataka o njegovoj strukturi.

Po svojoj namjeni M. l. prvenstveno je oruđe teorijske lingvistike. Istodobno, njegove se metode široko koriste u primijenjenim lingvističkim istraživanjima - automatska obrada teksta, automatsko prevođenje i razvoj povezan s takozvanom komunikacijom između ljudi i računala.

  • Kulagina O. S., O jednom načinu definiranja gramatičkih pojmova na temelju teorije skupova, u: Problemi kibernetike, v. 1, M., 1958;
  • Chomsky N., Sintaktičke strukture, u: “Novo u lingvistici”, v. 2, M., 1962;
  • Glatko, nesmetano A.V., Melchuk I. A., Elementi matematičke lingvistike, M., 1969 (lit.);
  • njihov, Gramatike stabala, I, II, u: Informacijska pitanja semiotike, lingvistike i automatskog prevođenja, u. 1, 4, M., 1971-74 (lit.);
  • Marcus S., Skupovno-teorijski modeli jezika, trans. s engleskog, M., 1970 (lit.);
  • Glatko, nesmetano A.V., Formalne gramatike i jezici, M., 1973 (lit.);
  • njegov, Pokušaj formalnog definiranja pojmova padeža i roda imenice, u zbirci: Problemi gramatičkog modeliranja, M., 1973 (lit.);
  • njegov, Sintaktičke strukture prirodnog jezika u automatiziranim komunikacijskim sustavima, M., 1985 (lit.);
  • Suhotin B.V., Optimizacijske metode za istraživanje jezika. M., 1976 (lit.);
  • Sevbo I.P., Grafičko prikazivanje sintaktičkih struktura i stilska dijagnostika, K., 1981.;
  • Zabava B. Kh., Montaguova gramatika, mentalne reprezentacije i stvarnost, u knjizi: Semiotika, M., 1983;
  • Montague R., Formalna filozofija, New Haven - L., 1974(lit.).

Sadržaj
Uvod
Poglavlje 1. Povijest primjene matematičkih metoda u lingvistici
1.1. Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće
1.2. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća
Zaključak
Književnost
Uvod
U 20. stoljeću nastavlja se trend interakcije i prožimanja različitih područja znanja, granice između pojedinih znanosti postupno se brišu; Sve je više grana umne djelatnosti koje su “na sjecištu” humanitarnih, tehničkih i prirodoslovnih spoznaja.
Još jedna očita značajka modernosti je želja za proučavanjem struktura i njihovih sastavnih elemenata. Stoga se sve više mjesta kako u znanstvenoj teoriji tako iu praksi daje matematici. Dolazeći u dodir, s jedne strane, s logikom i filozofijom, s druge strane, sa statistikom (a time i s društvenim znanostima), matematika zadire sve dublje u ona područja koja su se dugo vremena smatrala čisto “humanitarnim, ” šireći njihov heuristički potencijal (odgovor na pitanje “koliko” često će pomoći odgovoriti na pitanja “što” i “kako”). Lingvistika nije bila iznimka.Svrha mog kolegija je ukratko osvijetliti vezu između matematike i takve grane lingvistike kao što je lingvistika. Od 50-ih godina prošlog stoljeća matematika se koristi u lingvistici za stvaranje teorijskog aparata za opisivanje strukture jezika (kako prirodnih tako i umjetnih). Ipak, treba reći da nije odmah pronašla nešto slično sebi. praktičnu upotrebu. U početku su se matematičke metode u lingvistici počele primjenjivati ​​kako bi se razjasnili osnovni pojmovi lingvistike, no razvojem računalne tehnologije takva se teorijska premisa počela koristiti u praksi. Rješavanje problema kao što su strojno prevođenje, strojno pronalaženje informacija i automatska obrada teksta zahtijevalo je potpuno novi pristup jeziku. Za lingviste se postavilo pitanje: kako naučiti predstavljati jezične obrasce u obliku u kojem se mogu izravno primijeniti na tehnologiju. Izraz "matematička lingvistika", koji je popularan u naše vrijeme, odnosi se na svako lingvističko istraživanje koje koristi egzaktne metode (a pojam egzaktnih metoda u znanosti uvijek je usko povezan s matematikom). Neki znanstvenici prošlih godina smatraju da se sam izraz ne može uzdići na razinu pojma, jer ne označava nikakvu posebnu "lingvistiku", već samo novi smjer usmjeren na poboljšanje, povećanje točnosti i pouzdanosti metoda istraživanja jezika. Lingvistika koristi i kvantitativne (algebarske) i nekvantitativne metode, čime se približava matematičkoj logici, a posljedično i filozofiji, pa i psihologiji. Schlegel je također uočio međudjelovanje jezika i svijesti, a istaknuti lingvist s početka dvadesetog stoljeća Ferdinand de Saussure (o njegovom utjecaju na razvoj matematičkih metoda u lingvistici govorit ću kasnije) povezuje strukturu jezika s njegovom pripadnošću narod. Suvremeni istraživač L. Perlovsky ide dalje, poistovjećujući kvantitativne karakteristike jezika (na primjer, broj rodova, padeža) sa karakteristikama nacionalnog mentaliteta (više o tome u odjeljku 2.2, “Statističke metode u lingvistici”).
Interakcija matematike i lingvistike višestruka je tema, au svom radu neću se fokusirati na sve njih, već prije svega na njezine primijenjene aspekte.
Poglavlje I. Povijest primjene matematičkih metoda u lingvistici
1.1 Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće
Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja seže do poznatog švicarskog lingvista s početka dvadesetog stoljeća, Ferdinanda de Saussurea.
Početna poveznica njegovog koncepta je teorija jezika kao sustava koji se sastoji od tri dijela (sam jezik - langue, govor - parole i govorna aktivnost - langage), u kojem se svaka riječ (član sustava) ne promatra sama za sebe. , ali u vezi s drugima ...

Koliko košta pisanje vašeg rada?

Odaberite vrstu rada Diplomski rad (diplomski/specijalistički) Dio rada Magistarski diplomski Predmetni rad s vježbom Teorija predmeta Sažetak Esej Testni rad Ciljevi Certificirani rad (VAR/VKR) Poslovni plan Pitanja za ispit MBA diplomski rad (viša/tehnička škola) Ostalo Slučajevi Laboratorijski rad, RGR Online pomoć Izvještaj s prakse Pretraživanje informacija PowerPoint prezentacija Sažetak za diplomski studij Popratni materijali za diplomski Članak Testovi Crteži više »

Hvala, poslana vam je e-pošta. Provjerite e-poštu.

Želite li promo kod za 15% popusta?

Primi SMS
s promotivnim kodom

Uspješno!

?Navedite promotivni kod tijekom razgovora s upraviteljem.
Promotivni kod možete primijeniti jednom prilikom prve narudžbe.
Vrsta promotivnog koda - " diplomski rad".

Interakcija matematike i lingvistike


Uvod

Poglavlje 1. Povijest primjene matematičkih metoda u lingvistici

1.1. Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće

1.2. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1. Strojno prevođenje

2.2. Statističke metode u učenju jezika

2.3. Učenje jezika metodama formalne logike

2.4. Perspektive primjene matematičkih metoda u lingvistici

Zaključak

Književnost

Dodatak 1. Ronald Schleifer. Ferdinand de Saussure

Dodatak 2. Ferdinand de Saussure (prijevod)

Uvod


U dvadesetom stoljeću postojao je kontinuirani trend interakcije i prožimanja različitih područja znanja. Granice između pojedinih znanosti postupno se brišu; Sve je više grana umne djelatnosti koje su “na sjecištu” humanitarnih, tehničkih i prirodoslovnih spoznaja.

Još jedna očita značajka modernosti je želja za proučavanjem struktura i njihovih sastavnih elemenata. Stoga se sve više mjesta kako u znanstvenoj teoriji tako iu praksi daje matematici. Dolazeći u dodir, s jedne strane, s logikom i filozofijom, s druge strane, sa statistikom (a time i s društvenim znanostima), matematika zadire sve dublje u ona područja koja su se dugo vremena smatrala čisto “humanitarnim, ” šireći njihov heuristički potencijal (odgovor na pitanje “koliko” često će pomoći odgovoriti na pitanja “što” i “kako”). Lingvistika nije bila iznimka.

Svrha mog kolegija je ukratko osvijetliti vezu između matematike i takve grane lingvistike kao što je lingvistika. Od 50-ih godina prošlog stoljeća matematika se koristi u lingvistici za stvaranje teorijskog aparata za opisivanje strukture jezika (kako prirodnih tako i umjetnih). Međutim, treba reći da nije odmah našao takvu praktičnu primjenu. U početku su se matematičke metode u lingvistici počele primjenjivati ​​kako bi se razjasnili osnovni pojmovi lingvistike, no razvojem računalne tehnologije takva se teorijska premisa počela koristiti u praksi. Rješavanje problema kao što su strojno prevođenje, strojno pronalaženje informacija i automatska obrada teksta zahtijevalo je potpuno novi pristup jeziku. Za lingviste se postavilo pitanje: kako naučiti predstavljati jezične obrasce u obliku u kojem se mogu izravno primijeniti na tehnologiju. Izraz "matematička lingvistika", koji je popularan u naše vrijeme, odnosi se na svako lingvističko istraživanje koje koristi egzaktne metode (a pojam egzaktnih metoda u znanosti uvijek je usko povezan s matematikom). Neki znanstvenici prošlih godina smatraju da se sam izraz ne može uzdići u rang pojma, jer ne označava nikakvu posebnu "lingvistiku", već samo novi smjer usmjeren na poboljšanje, povećanje točnosti i pouzdanosti metoda istraživanja jezika. Lingvistika koristi i kvantitativne (algebarske) i nekvantitativne metode, čime se približava matematičkoj logici, a posljedično i filozofiji, pa i psihologiji. Schlegel je također uočio međudjelovanje jezika i svijesti, a istaknuti lingvist s početka dvadesetog stoljeća Ferdinand de Saussure (o njegovom utjecaju na razvoj matematičkih metoda u lingvistici govorit ću kasnije) povezuje strukturu jezika s njegovom pripadnošću narod. Suvremeni istraživač L. Perlovsky ide dalje, poistovjećujući kvantitativne karakteristike jezika (na primjer, broj rodova, padeža) sa karakteristikama nacionalnog mentaliteta (više o tome u odjeljku 2.2, “Statističke metode u lingvistici”).

Interakcija matematike i lingvistike višestruka je tema, au svom radu neću se fokusirati na sve njih, već prije svega na njezine primijenjene aspekte.

Poglavlje I. Povijest primjene matematičkih metoda u lingvistici


1.1 Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće


Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja seže do poznatog švicarskog lingvista s početka dvadesetog stoljeća, Ferdinanda de Saussurea.

Početna poveznica njegovog koncepta je teorija jezika kao sustava koji se sastoji od tri dijela (sam jezik - langue, govor - parole i govorna aktivnost - langage), u kojem se svaka riječ (član sustava) ne promatra sama za sebe. , ali u vezi s drugim članovima. Kao što je kasnije primijetio još jedan istaknuti lingvist, Danac Louis Hjelmslev, Saussure je “bio prvi koji je zahtijevao strukturalni pristup jeziku, to jest znanstveni opis jezika bilježenjem odnosa između jedinica.”

Shvaćajući jezik kao hijerarhijsku strukturu, Saussure je prvi postavio problem vrijednosti i značaja jezičnih jedinica. Pojedinačne pojave i događaje (recimo, povijest nastanka pojedinih indoeuropskih riječi) ne treba proučavati same za sebe, nego u sustavu u kojemu su u korelaciji sa sličnim sastavnicama.

Saussure je strukturnu jedinicu jezika smatrao riječju, "znakom", u kojem su spojeni zvuk i značenje. Nijedan od ovih elemenata ne postoji jedan bez drugoga: dakle, izvorni govornik shvaća različite nijanse značenja višeznačne riječi kao zaseban element u strukturnoj cjelini, u jeziku.

Tako se u teoriji F. de Saussurea može uočiti interakcija lingvistike, s jedne strane, sa sociologijom i socijalnom psihologijom (valja napomenuti da se u isto vrijeme razvijaju Husserlova fenomenologija, Freudova psihoanaliza, Einsteinova teorija relativnosti). , odvijali su se eksperimenti s formom i sadržajem u književnosti, glazbi i likovnim umjetnostima), s druge strane, s matematikom (pojam sustavnosti odgovara algebarskom pojmu jezika). Taj je koncept promijenio koncept jezične interpretacije kao takve: fenomeni se nisu počeli tumačiti u odnosu na razloge njihova nastanka, već u odnosu na sadašnjost i budućnost. Tumačenje više nije neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, "nesvjesne" u frojdovskom smislu riječi).

Djelovanje jezičnog mehanizma očituje se kroz govornu aktivnost izvornih govornika. Rezultat govora su takozvani "ispravni tekstovi" - nizovi govornih jedinica koje se pokoravaju određenim obrascima, od kojih mnogi dopuštaju matematički opis. Teorija metoda za opisivanje sintaktičke strukture bavi se proučavanjem načina matematičkog opisa ispravnih tekstova (prvenstveno rečenica). U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih kvaliteta, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Na Zapadu Saussureove ideje razvijaju mlađi suvremenici velikog švicarskog lingvista: u Danskoj - već spomenuti L. Hjelmslev, koji je u svom djelu "Osnove lingvističke teorije" pokrenuo algebarsku teoriju jezika, u SAD-u - E. Sapir, L. Bloomfield, C. Harris, u Češkoj - ruski emigrantski znanstvenik N. Trubetskoy.

Statističke obrasce u proučavanju jezika počeo je proučavati nitko drugi nego utemeljitelj genetike, Georg Mendel. Tek 1968. godine filolozi su otkrili da je u posljednjim godinama svog života bio oduševljen proučavanjem jezičnih pojava matematičkim metodama. Mendel je ovu metodu donio u lingvistiku iz biologije; devedesetih godina devetnaestog stoljeća samo su najhrabriji lingvisti i biolozi izjavljivali izvedivost takve analize. U arhivu samostana sv. Tomaša u Brnu, gdje je Mendel bio opat, pronađeni su listovi sa stupcima prezimena koja završavaju na “mann”, “bauer”, “mayer”, te s nekim razlomcima i izračunima. Nastojeći otkriti formalne zakonitosti nastanka obiteljskih imena, Mendel izvodi složene proračune, u kojima uzima u obzir broj samoglasnika i suglasnika u njemačkom jeziku, ukupan broj riječi koje razmatra, broj prezimena, itd.

Kod nas se strukturalna lingvistika počela razvijati otprilike u isto vrijeme kad i na Zapadu - na prijelazu iz 19. u 20. stoljeće. Istodobno s F. de Saussureom, koncept jezika kao sustava razvijen je u djelima profesora Sveučilišta u Kazanu F.F. Fortunatov i I.A. Baudouin de Courtenay. Potonji se dugo dopisivao s de Saussureom, pa su ženevska i kazanska lingvistička škola surađivale jedna s drugom. Ako se Saussurea može nazvati ideologom “egzaktnih” metoda u lingvistici, onda je Baudouin de Courtenay postavio praktične temelje za njihovu primjenu. Prvi je odvojio lingvistiku (kao egzaktnu znanost koja se koristi statističkim metodama i funkcionalnom ovisnošću) od filologije (zajednice humanitarnih disciplina koje proučavaju duhovnu kulturu kroz jezik i govor). Sam je znanstvenik vjerovao da "lingvistika može biti korisna u bliskoj budućnosti samo ako se oslobodi obvezne veze s filologijom i poviješću književnosti". Fonologija je postala “poligon” za uvođenje matematičkih metoda u lingvistiku - glasovi kao “atomi” jezičnog sustava, s ograničenim brojem lako mjerljivih svojstava, bili su najprikladniji materijal za formalne, stroge metode opisa. Fonologija negira postojanje značenja u zvuku, pa je u istraživanju eliminiran “ljudski” faktor. U tom smislu, fonemi su poput fizičkih ili bioloških objekata.

Fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu sferu, zasebnu “fenomenološku stvarnost”. Na primjer, u engleskom se glas "t" može izgovoriti na različite načine, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Glavno je da će fonem obavljati svoju glavnu funkciju - razlikovanje značenja. Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" su različiti u engleskom, dok su u drugim jezicima varijacije istog fonema (poput engleskog "t", izgovara se aspirirano ili neaspirirano). Opsežna leksikon svaki prirodni jezik je skup kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika predstavljaju sustavno organiziran skup značajki. U 1920-im i 1930-ima, slijedeći Saussurea, Jacobson i N.S. Trubetskoy identificirali su "različite značajke" fonema. Ove značajke temelje se na građi govornih organa - jezika, zuba, glasnica. Recimo, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg lingvističkog pravila koje je opisao Saussure: "U jeziku postoje samo razlike." Ono što je važnije nije čak ni ovo: razlika obično podrazumijeva precizne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da smatramo "označavanjem" ili "označenim", ne postoje koncepti ili glasovi u jeziku koji su postojali prije nego što se jezični sustav razvio.

Stoga se u saussureovskoj lingvistici fenomen koji se proučava shvaća kao skup usporedbi i kontrasta jezika. Jezik je i izraz značenja riječi i sredstvo komunikacije, a te se dvije funkcije nikad ne podudaraju. Možemo primijetiti izmjenu oblika i sadržaja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u morfeme, morfemi u riječi, riječi u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od zbroja svojih dijelova.

Saussure je predložio ideju nove znanosti dvadesetog stoljeća, odvojene od lingvistike, koja je proučavala ulogu znakova u društvu. Saussure je ovu znanost nazvao semiologijom (od grčkog “semeoon” - znak). "Znanost" semiotike, koja se razvila u Istočnoj Europi 1920-ih-1930-ih iu Parizu 1950-1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili formulirana) korištenjem tih struktura. Osim toga, u zalasku svoje karijere, paralelno s tečajem opće lingvistike, Saussure je započeo “semiotičku” analizu kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bila je to pokušaj da se u sustavu prouči problem "vjerojatnosti" u jeziku. Takvo istraživanje pomaže usredotočiti se na “materijalnu stranu” vjerojatnosti; “ključna riječ”, čiji anagram Saussure traži, kako tvrdi Jean Starobinsky, “oruđe za pjesnika, a ne izvor života pjesme”. Pjesma služi za preokretanje zvukova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure ne ulazi u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna želja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi stvaraju, ona nadilazi kontrolu svijesti i ovisi samo o zakonima jezika” (vidi . Prilog 1).

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji naglašava jednu od sastavnica njegove jezične analize – proizvoljnu prirodu znakova, kao i formalnu bit Saussureove lingvistike koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas Saussureovi radovi čine neobično dosljednima u svojoj nevoljkosti da proučavaju simbole fenomena koji imaju jasno definirano značenje [Dodatak 1]. Proučavajući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne varijante. . . . Proučavajući Nibelungenlied, on identificira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerni, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on sugerira postojanje semiologije koja opisuje više od pukih jezičnih znakova; ali ta je pretpostavka ograničena činjenicom da semiologija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti “namjeru” bez objekta; nije mogao do kraja prevladati jaz između forme i sadržaja – u njegovim se djelima to pretvorilo u pitanje. Umjesto toga, pozvao se na "jezičnu zakonitost". Smješten između, s jedne strane, devetnaestostoljetnih koncepata utemeljenih na povijesti i subjektivnom nagađanju, te metoda kontingentnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koji brišu suprotnost između forme i sadržaja (subjekt i objekt), značenje i podrijetlo u strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici, spisi Ferdinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i kulturi.

Ruski su znanstvenici također bili zastupljeni na Prvom međunarodnom kongresu lingvista u Haagu 1928. godine. S. Kartsevsky, R. Jacobson i N. Trubetskoy dali su referat koji je ispitivao hijerarhijsku strukturu jezika - u duhu najsuvremenijih ideja s početka prošlog stoljeća. Jacobson je u svojim radovima razvijao Saussureove ideje da osnovne elemente jezika treba proučavati, prije svega, u vezi s njihovim funkcijama, a ne s razlozima njihova nastanka.

Nažalost, dolaskom Staljina na vlast 1924. domaće je jezikoslovlje, kao i mnoge druge znanosti, bačeno unazad. Mnogi talentirani znanstvenici bili su prisiljeni emigrirati, protjerani iz zemlje ili umrli u logorima. Tek od sredine 1950-ih postao je moguć neki pluralizam teorija - više o tome u odjeljku 1.2.


1.2 Primjena matematičkih metoda u lingvistici u drugoj polovici dvadesetog stoljeća


Do sredine dvadesetog stoljeća formirale su se četiri svjetske lingvističke škole, od kojih se svaka pokazala rodonačelnikom određene "egzaktne" metode. Lenjingradska fonološka škola (njezin osnivač je bio učenik Baudouina de Courtenaya L.V. Shcherba) koristila je psiholingvistički eksperiment temeljen na analizi govora izvornih govornika kao glavni kriterij za generalizaciju zvuka u obliku fonema.

Znanstvenici Praškog lingvističkog kruga, posebice njegov osnivač N.S. Trubetskoy, koji je emigrirao iz Rusije, razvio je teoriju opreka - semantičku strukturu jezika oni su opisali kao skup oprečno izgrađenih semantičkih jedinica - obitelji. Ova se teorija koristila u proučavanju ne samo jezika, već i umjetničke kulture.

Ideolozi američkog deskriptivizma bili su lingvisti L. Bloomfield i E. Sapir. Deskriptivistima je jezik predstavljen kao skup govornih iskaza koji su bili glavni predmet njihova istraživanja. Njihov fokus bio je na pravilima znanstvenog opisa (otuda i naziv) tekstova: proučavanje organizacije, rasporeda i klasifikacije njihovih elemenata. Formalizacija analitičkih postupaka u području fonologije i morfologije (razvoj načela za proučavanje jezika na različitim razinama, distribucijska analiza, metoda izravnih sastavnica itd.) dovela je do formuliranja općih pitanja jezičnog modeliranja. Zanemarivanje plana sadržaja jezika, kao i paradigmatske strane jezika, nije omogućilo deskriptivistima da u potpunosti protumače jezik kao sustav.

Šezdesetih godina 20. stoljeća razvila se teorija formalnih gramatika koja je nastala uglavnom zahvaljujući radovima američkog filozofa i lingvista N. Chomskog. S pravom se smatra jednim od najpoznatijih suvremenih znanstvenika i javnih osoba, posvećeni su mu mnogi članci, monografije, pa čak i cjelovečernji dokumentarni film. Po temeljno novom načinu opisivanja sintaktičke strukture koji je izumio Chomsky - generativnoj (generativnoj) gramatici - odgovarajući pokret u lingvistici nazvan je generativizam.

Chomsky, potomak imigranata iz Rusije, studirao je lingvistiku, matematiku i filozofiju na Sveučilištu u Pennsylvaniji od 1945., dok je pod snažan utjecaj njegov učitelj Zelig Harris - kao i Harris, Chomsky je svoje političke stavove smatrao i smatra bliskima anarhizmu (i danas je poznat kao kritičar postojećeg američkog političkog sustava i kao jedan od duhovnih vođa antiglobalizma).

Chomskyjev prvi veliki znanstveni rad, njegov magistarski rad "Morfologija modernog hebrejskog" (1951.), ostao je neobjavljen. Chomsky je doktorirao na Sveučilištu u Pennsylvaniji 1955., no veliki dio istraživanja koji je činio temelj njegove disertacije (objavljene u cijelosti tek 1975. pod naslovom “Logična struktura lingvističke teorije”) i njegove prve monografije, “Sintaktička Strukture” (Sintaktičke strukture, 1957., rus. prev. 1962.), izvedena je na Sveučilištu Harvard 1951–1955. Iste 1955. godine znanstvenik se preselio na Tehnološki institut u Massachusettsu, gdje je 1962. godine postao profesor.

U svom razvoju Chomskyjeva teorija prošla je kroz nekoliko faza.

U svojoj prvoj monografiji, "Sintaktičke strukture", znanstvenik je predstavio jezik kao mehanizam za generiranje beskonačnog broja rečenica pomoću konačnog skupa gramatičkih sredstava. Kako bi opisao jezična svojstva, predložio je koncepte dubokih (skrivenih od izravne percepcije i generiranih sustavom rekurzivnih, tj. pravila koja se mogu primjenjivati ​​više puta) i površinskih (izravno percipiranih) gramatičkih struktura, kao i transformacije koje opisuju prijelaz iz dubinskih struktura u površinske. Jedna dubinska struktura može odgovarati nekoliko površinskih (na primjer, pasivna konstrukcija Ukaz potpisuje predsjednik izvedena je iz iste dubinske strukture kao i aktivna konstrukcija Predsjednik potpisuje dekret) i obrnuto (na primjer, višeznačnost Majka voli svoju kćer opisana je kao rezultat slučajnosti površinskih struktura koje sežu u dvije različite dubine, u jednoj od kojih je majka ona koja voli kćer, a u drugoj ona koju kći voli).

Chomskyjeva standardna teorija je model aspekata, izložen u Chomskyjevoj knjizi Aspekti teorije sintakse. U ovom modelu, pravila semantičke interpretacije koja pripisuju značenje dubokim strukturama uvedena su u formalnu teoriju po prvi put. U “Aspektima” je jezična kompetencija suprotstavljena upotrebi jezika (izvedbi), usvojena je tzv. Katz-Postalova hipoteza o očuvanju značenja tijekom transformacije, pa je stoga isključen koncept neobvezne transformacije, a aparatura uvode se sintaktička obilježja koja opisuju leksičku spojivost.

Sedamdesetih godina prošlog stoljeća Chomsky je radio na teoriji upravljanja i obvezivanja (GB teorija – od riječi vlada i obvezujući) – općenitijoj od prethodne. U njemu je znanstvenik napustio određena pravila koja opisuju sintaktičke strukture određenih jezika. Sve transformacije zamijenjene su jednom univerzalnom transformacijom poteza. U okviru GB teorije postoje i privatni moduli od kojih je svaki odgovoran za svoj dio gramatike.

Još 1995. Chomsky je iznio minimalistički program u kojem je ljudski jezik opisan kao sličan strojnom jeziku. Ovo je samo program - ne model ili teorija. U njemu Chomsky identificira dva glavna podsustava ljudskog jezičnog aparata: leksikon i računalni sustav, kao i dva sučelja - fonetsko i logičko.

Chomskyjeve formalne gramatike postale su klasične za opisivanje ne samo prirodnih, već i umjetnih jezika - posebno programskih jezika. Razvoj strukturalne lingvistike u drugoj polovici dvadesetog stoljeća s pravom se može smatrati “Chomskyjevom revolucijom”.

Moskovska fonološka škola, čiji su predstavnici bili A.A. Reformatsky, V.N. Sidorov, P.S. Kuznjecov, A.M. Suhotin, R.I. Avanesov, koristio je sličnu teoriju za proučavanje fonetike. Postupno se "točne" metode počinju primjenjivati ​​ne samo na fonetiku, već i na sintaksu. I lingvisti i matematičari, kod nas i u inozemstvu, počinju proučavati strukturu jezika. U 1950-60-ima u SSSR-u je započela nova faza u interakciji matematike i lingvistike, povezana s razvojem sustava za strojno prevođenje.

Poticaj za početak ovog rada u našoj zemlji bila su prva dostignuća u području strojnog prevođenja u SAD-u (iako je prvi uređaj za mehanizirano prevođenje P.P. Smirnov-Troyansky izumljen u SSSR-u još 1933. godine, on je, budući da je primitivan, nije postalo široko rasprostranjeno). Godine 1947. A. Butt i D. Britten smislili su kod za prijevod riječ po riječ pomoću računala, a godinu dana kasnije R. Richens predložio je pravilo za dijeljenje riječi na korijene i završetke u strojnom prijevodu. Te su godine bile dosta drugačije od modernih. Bili su to vrlo veliki i skupi strojevi koji su zauzimali cijele prostorije i zahtijevali veliki broj inženjera, operatera i programera za njihovo održavanje. Uglavnom, ta su računala služila za izvođenje matematičkih proračuna za potrebe vojnih institucija - novosti u matematici, fizici i tehnici služile su, prije svega, vojnim poslovima. U ranim fazama razvoj MP-a aktivno je podržavala vojska, dok se (tijekom Hladnog rata) u SAD-u razvio rusko-engleski, a u SSSR-u anglo-ruski smjer.

U siječnju 1954. na Tehničkom sveučilištu Massachusetts održan je “Georgetownski eksperiment” - prva javna demonstracija prijevoda s ruskog na engleski na stroju IBM-701. Sažetak poruke o uspješnom završetku eksperimenta, napravio D.Yu. Panov, pojavio se u Russian Journal of Mathematics, 1954., br. 10: “Prijevod s jednog jezika na drugi pomoću stroja: izvješće o prvom uspješnom testu.”

D. Yu. Panov (u to vrijeme direktor Instituta za znanstvene informacije - INI, kasnije VINITI) privukao je I. K. Belskaya da radi na strojnom prevođenju, koji će kasnije voditi grupu za strojno prevođenje na Institutu za preciznu matematiku i računalne znanosti Sveučilišta u Zagrebu. Akademija znanosti SSSR-a. Prvo iskustvo prevođenja s engleskog na ruski pomoću stroja BESM datira iz 1955. godine. Programe za BESM sastavio je N.P. Trifonov i L.N. Korolev, čija je doktorska disertacija bila posvećena metodama za izradu rječnika za strojno prevođenje.

Paralelno se radilo na strojnom prevođenju u Odjelu za primijenjenu matematiku Matematičkog instituta Akademije znanosti SSSR-a (sada Institut za primijenjenu matematiku M.V. Keldysh Ruske akademije znanosti). Na inicijativu matematičara A.A. Ljapunova. U rad na prevođenju tekstova pomoću stroja Strela s francuskog na ruski uključio je studenta diplomskog studija Matematičkog instituta Steklov O.S. Kulagin i njegovi učenici T.D. Ventzel i N.N. Ricco. Ideje Ljapunova i Kulagine o mogućnosti korištenja tehnologije za prevođenje s jednog jezika na drugi objavljene su u časopisu Nature, 1955., br. 8. Od kraja 1955. godine pridružili su im se T.N. Moloshnaya, koji je tada započeo samostalan rad na algoritmu za englesko-ruski prijevod.

R. Frumkina, koja se u to vrijeme bavila algoritamskim prijevodom sa španjolskog, prisjeća se da je u ovoj fazi rada bilo teško poduzeti bilo kakve dosljedne korake. Puno češće sam morao slijediti heurističko iskustvo - vlastito ili svojih kolega.

Međutim, prva generacija sustava za strojno prevođenje bila je vrlo nesavršena. Svi su se temeljili na algoritmima konsekutivnog prevođenja "riječ po riječ", "fraza po fraza" - semantičke veze između riječi i rečenica nisu ni na koji način uzete u obzir. Na primjer, možete dati sljedeće rečenice: “John je tražio svoju kutiju za igračke. Napokon ga je pronašao. Kutija je bila u olovci. John je bio jako sretan. (John je tražio svoju kutiju za igračke. Napokon ju je našao. Kutija je bila u igralištu. John je bio jako sretan.)” "Polovka" u ovom kontekstu nije "olovka" (pisaći instrument), već "ogradica za igru" (olovka za igru). Poznavanje sinonima, antonija i figurativnih značenja teško je unijeti u računalo. Smjer koji obećava bio je razvoj strojnih sustava namijenjenih ljudskom prevoditelju.

S vremenom su izravni sustavi prevođenja zamijenjeni T-sustavima (od engleske riječi "transfer" - transformacija), u kojima se prijevod provodio na razini sintaktičkih struktura. Algoritmi T-sustava koristili su mehanizam koji im je omogućio da izgrade sintaktičku strukturu prema pravilima gramatike jezika ulazne rečenice (slično kao što uče strani jezik u srednjoj školi), a zatim sintetiziraju izlaznu rečenicu, preoblikovanje sintaktičke strukture i zamjena potrebnih riječi iz rječnika.

Ljapunov je govorio o prijevodu izvlačenjem značenja prevedenog teksta i njegovim predstavljanjem na drugom jeziku. Pristup izgradnji sustava za strojno prevođenje koji se temelji na dobivanju semantičke reprezentacije ulazne rečenice njezinom semantičkom analizom i sintezom ulazne rečenice na temelju rezultirajuće semantičke reprezentacije još uvijek se smatra najnaprednijim. Takvi se sustavi nazivaju I-sustavi (od riječi "interlingua"). No, zadatak njihova stvaranja, postavljen kasnih 50-ih i ranih 60-ih, još uvijek nije u potpunosti riješen, unatoč naporima Međunarodne federacije IFIP, globalne zajednice znanstvenika u području obrade informacija.

Znanstvenici su razmišljali o tome kako formalizirati i izgraditi algoritme za rad s tekstovima, koje rječnike treba unijeti u stroj, koje lingvističke obrasce treba koristiti u strojnom prevođenju. Tradicionalna lingvistika nije imala takve ideje – ne samo u smislu semantike, nego ni u smislu sintakse. Ni za jedan jezik u to vrijeme nije bilo popisa sintaktičkih struktura, nisu proučavani uvjeti njihove kompatibilnosti i zamjenjivosti, a nisu razvijena pravila za izgradnju velikih jedinica sintaktičke strukture od manjih sastavnih elemenata.

Potreba za stvaranjem teorijskih temelja za strojno prevođenje dovela je do nastanka i razvoja matematičke lingvistike. Vodeću ulogu u ovom pitanju u SSSR-u igrali su matematičari A.A. Ljapunov, O.S. Kulagina, V.A. Uspenski, lingvisti V.Yu. Rosenzweig, P.S. Kuznjecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulagina je disertacija bila posvećena proučavanju formalne teorije gramatika (istodobno s N. Chomskim u SAD-u), Kuznjecov je iznio problem aksiomatizacije lingvistike, vraćajući se na radove F.F. Fortunatova.

Dana 6. svibnja 1960. godine usvojena je Rezolucija Prezidija Akademije znanosti SSSR-a „O razvoju strukturnih i matematičkih metoda istraživanja jezika“, au Institutu za lingvistiku i Institutu za ruski jezik osnovani su odgovarajući odjeli. Od 1960. vodeća humanitarna sveučilišta u zemlji - Filološki fakultet Moskovskog državnog sveučilišta, Lenjinrad, Novosibirska sveučilišta, Moskovski državni pedagoški institut stranih jezika - započela su obuku osoblja u području automatske obrade teksta.

Međutim, rad na strojnom prevođenju iz tog razdoblja, nazvanog "klasično" razdoblje, više je od teorijskog nego praktičnog interesa. Isplativi sustavi za strojno prevođenje počeli su se stvarati tek osamdesetih godina prošlog stoljeća. O tome ću govoriti kasnije, u odjeljku 2.1, “Strojno prevođenje”.

1960-ih i 70-ih godina došlo je do dubokog teorijskog razvoja korištenjem metoda teorije skupova i matematičke logike, kao što su teorija polja i teorija neizrazitih skupova.

Autor teorije polja u lingvistici bio je sovjetski pjesnik, prevoditelj i lingvist V.G. Opominjanje. Svoju je teoriju u početku razvio na temelju njemačkog jezika. U Admoniju koncept “polja” označava proizvoljan neprazan skup jezičnih elemenata (na primjer, “leksičko polje”, “semantičko polje”).

Struktura polja je heterogena: sastoji se od jezgre, čiji elementi imaju pun skup karakteristika koje definiraju skup, i periferije, čiji elementi mogu imati obje karakteristike danog skupa (ne sve) i susjednih. Dopustite mi da dam primjer da ilustriram ovu tvrdnju: recimo, u engleskom jeziku, polje složenih riječi ("day-dream" - "dream" teško je odvojiti od polja fraza ("suzavac")).

Već spomenuta teorija neizrazitih skupova usko je povezana s teorijom polja. U SSSR-u su njegovo utemeljenje proveli lingvisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, ali njezin je utemeljitelj američki matematičar L. Zade, koji je 1965. godine objavio članak “Fuzzy Logic”. Dajući matematičko opravdanje za teoriju neizrazitih skupova, Zadeh ih je razmatrao koristeći se lingvističkim materijalom.

U ovoj teoriji ne govorimo toliko o pripadnosti elemenata danom skupu (AOa), koliko o stupnju tog članstva (mAOa), budući da periferni elementi mogu, u jednom ili drugom stupnju, pripadati nekoliko polja. Zade (Lofti-zade) je bio porijeklom iz Azerbejdžana, do svoje 12. godine imao je praksu komuniciranja na četiri jezika - azerbejdžanskom, ruskom, engleskom i perzijskom - i koristio je tri različita pisma: ćirilicu, latinicu, arapski. Kada znanstvenika pitaju što je zajedničko teoriji neizrazitih skupova i lingvistici, on ne poriče tu vezu, ali pojašnjava: “Nisam siguran da je proučavanje ovih jezika imalo veliki utjecaj na moje razmišljanje. Ako se to dogodilo, možda je bilo podsvjesno.” Zadeh je u mladosti studirao u Teheranu u prezbiterijanskoj školi, a nakon Drugog svjetskog rata emigrirao je u SAD. “Nije pitanje jesam li ja Amerikanac, Rus, Azerbajdžanac ili što već”, rekao je

Slični sažeci:

Jezik i govor kao jedan od temeljnih problema stilistike. Pojam fonema i fonološke razine. Pojam jezika kao sustava i razine jezičnog sustava. Pojam morfema i njihove vrste. Rečenica kao sintaktička jedinica teksta. Znakovi jezičnog sustava.

Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće. Statističke metode u učenju jezika. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća. Učenje jezika metodama formalne logike. Značajke strojnog prevođenja.

UVOD

Poglavlje 1. Povijest primjene matematičkih metoda u lingvistici

1.1. Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće

1.2. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1. Strojno prevođenje

2.2. Statističke metode u učenju jezika

2.3. Učenje jezika metodama formalne logike

2.4. Perspektive primjene matematičkih metoda u lingvistici

Zaključak

Književnost

Dodatak 1. Ronald Schleifer. Ferdinand de Saussure

Dodatak 2. Ferdinand de Saussure (prijevod)

UVOD

U dvadesetom stoljeću postojao je kontinuirani trend interakcije i prožimanja različitih područja znanja. Granice između pojedinih znanosti postupno se brišu; Sve je više grana umne djelatnosti koje su “na sjecištu” humanitarnih, tehničkih i prirodoslovnih spoznaja.

Još jedna očita značajka modernosti je želja za proučavanjem struktura i njihovih sastavnih elemenata. Stoga se sve više mjesta kako u znanstvenoj teoriji tako iu praksi daje matematici. Dolazeći u dodir, s jedne strane, s logikom i filozofijom, s druge strane, sa statistikom (a time i s društvenim znanostima), matematika zadire sve dublje u ona područja koja su se dugo vremena smatrala čisto “humanitarnim, ” šireći njihov heuristički potencijal (odgovor na pitanje “koliko” često će pomoći odgovoriti na pitanja “što” i “kako”). Lingvistika nije bila iznimka.

Svrha mog kolegija je ukratko osvijetliti vezu između matematike i takve grane lingvistike kao što je lingvistika. Od 50-ih godina prošlog stoljeća matematika se koristi u lingvistici za stvaranje teorijskog aparata za opisivanje strukture jezika (kako prirodnih tako i umjetnih). Treba reći da nije odmah našao takvu praktičnu primjenu. U početku su se matematičke metode u lingvistici počele primjenjivati ​​kako bi se razjasnili osnovni pojmovi lingvistike, no razvojem računalne tehnologije takva se teorijska premisa počela koristiti u praksi. Rješavanje problema kao što su strojno prevođenje, strojno pronalaženje informacija i automatska obrada teksta zahtijevalo je potpuno novi pristup jeziku. Za lingviste se postavilo pitanje: kako naučiti predstavljati jezične obrasce u obliku u kojem se mogu izravno primijeniti na tehnologiju. Izraz "matematička lingvistika", koji je popularan u naše vrijeme, odnosi se na svako lingvističko istraživanje koje koristi egzaktne metode (a pojam egzaktnih metoda u znanosti uvijek je usko povezan s matematikom). Neki znanstvenici prošlih godina smatraju da se sam izraz ne može uzdići u rang pojma, jer ne označava nikakvu posebnu "lingvistiku", već samo novi smjer usmjeren na poboljšanje, povećanje točnosti i pouzdanosti metoda istraživanja jezika. Lingvistika koristi i kvantitativne (algebarske) i nekvantitativne metode, čime se približava matematičkoj logici, a posljedično i filozofiji, pa i psihologiji. Schlegel je također uočio međudjelovanje jezika i svijesti, a istaknuti lingvist s početka dvadesetog stoljeća Ferdinand de Saussure (o njegovom utjecaju na razvoj matematičkih metoda u lingvistici govorit ću kasnije) povezuje strukturu jezika s njegovom pripadnošću narod. Suvremeni istraživač L. Perlovsky ide dalje, poistovjećujući kvantitativne karakteristike jezika (na primjer, broj rodova, padeža) sa karakteristikama nacionalnog mentaliteta (više o tome u odjeljku 2.2, “Statističke metode u lingvistici”).

Interakcija matematike i lingvistike višestruka je tema, au svom radu neću se fokusirati na sve njih, već prije svega na njezine primijenjene aspekte.

Poglavlje I.Povijest primjene matematičkih metoda u lingvistici

1.1 Pojava strukturne lingvistikena prijelazu iz 19. u 20. stoljeće

Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja seže do poznatog švicarskog lingvista s početka dvadesetog stoljeća, Ferdinanda de Saussurea.

Početna poveznica njegovog koncepta je teorija jezika kao sustava koji se sastoji od tri dijela (sam jezik - jezik, govor - lozinka, i govorna aktivnost - jezik), u kojem se svaka riječ (član sustava) ne razmatra sama za sebe, već u vezi s drugim članovima. Kao što je kasnije primijetio još jedan istaknuti lingvist, Danac Louis Hjelmslev, Saussure je “bio prvi koji je zahtijevao strukturalni pristup jeziku, to jest znanstveni opis jezika bilježenjem odnosa između jedinica.”

Shvaćajući jezik kao hijerarhijsku strukturu, Saussure je prvi postavio problem vrijednosti i značaja jezičnih jedinica. Pojedinačne pojave i događaje (recimo, povijest nastanka pojedinih indoeuropskih riječi) ne treba proučavati same za sebe, nego u sustavu u kojemu su u korelaciji sa sličnim sastavnicama.

Saussure je strukturnu jedinicu jezika smatrao riječju, "znakom", u kojem su spojeni zvuk i značenje. Nijedan od ovih elemenata ne postoji jedan bez drugoga: dakle, izvorni govornik shvaća različite nijanse značenja višeznačne riječi kao zaseban element u strukturnoj cjelini, u jeziku.

Tako se u teoriji F. de Saussurea može uočiti interakcija lingvistike, s jedne strane, sa sociologijom i socijalnom psihologijom (valja napomenuti da se u isto vrijeme razvijaju Husserlova fenomenologija, Freudova psihoanaliza, Einsteinova teorija relativnosti). , odvijali su se eksperimenti s oblikom i sadržajem u književnosti, glazbi i likovnoj umjetnosti), s druge strane - s matematikom (pojam sustavnosti odgovara algebarskom pojmu jezika). Taj je koncept promijenio koncept jezične interpretacije kao takve: fenomeni se nisu počeli tumačiti u odnosu na razloge njihova nastanka, već u odnosu na sadašnjost i budućnost. Tumačenje više nije neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, "nesvjesne" u frojdovskom smislu riječi).

Djelovanje jezičnog mehanizma očituje se kroz govornu aktivnost izvornih govornika. Rezultat govora su takozvani "ispravni tekstovi" - nizovi govornih jedinica koje se pokoravaju određenim obrascima, od kojih mnogi dopuštaju matematički opis. Teorija metoda za opisivanje sintaktičke strukture bavi se proučavanjem načina matematičkog opisa ispravnih tekstova (prvenstveno rečenica). U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih kvaliteta, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Na Zapadu Saussureove ideje razvijaju mlađi suvremenici velikog švicarskog lingvista: u Danskoj - već spomenuti L. Hjelmslev, koji je u svom djelu "Osnove lingvističke teorije" pokrenuo algebarsku teoriju jezika, u SAD-u - E. Sapir, L. Bloomfield, C. Harris, u Češkoj - ruski emigrantski znanstvenik N. Trubetskoy.

Statističke obrasce u proučavanju jezika počeo je proučavati nitko drugi nego utemeljitelj genetike, Georg Mendel. Tek 1968. godine filolozi su otkrili da je u posljednjim godinama svog života bio oduševljen proučavanjem jezičnih pojava matematičkim metodama. Mendel je ovu metodu donio u lingvistiku iz biologije; devedesetih godina devetnaestog stoljeća samo su najhrabriji lingvisti i biolozi izjavljivali izvedivost takve analize. U arhivu samostana sv. Tomaša u Brnu, gdje je Mendel bio opat, pronađeni su listovi sa stupcima prezimena koja završavaju na “mann”, “bauer”, “mayer”, te s nekim razlomcima i izračunima. Nastojeći otkriti formalne zakonitosti nastanka obiteljskih imena, Mendel izvodi složene proračune, u kojima uzima u obzir broj samoglasnika i suglasnika u njemačkom jeziku, ukupan broj riječi koje razmatra, broj prezimena, itd.

Kod nas se strukturalna lingvistika počela razvijati otprilike u isto vrijeme kao i na Zapadu - na prijelazu iz 19. u 20. stoljeće. Istodobno s F. de Saussureom, koncept jezika kao sustava razvijen je u djelima profesora Sveučilišta u Kazanu F.F. Fortunatov i I.A. Baudouin de Courtenay. Potonji se dugo dopisivao s de Saussureom, pa su ženevska i kazanska lingvistička škola surađivale jedna s drugom. Ako se Saussurea može nazvati ideologom “egzaktnih” metoda u lingvistici, onda je Baudouin de Courtenay postavio praktične temelje za njihovu primjenu. On je prvi odvojio lingvistiku (kao točan znanost koja se služi statističkim metodama i funkcionalnom ovisnošću) o filologiji (zajednica humanitarnih disciplina koje proučavaju duhovnu kulturu jezikom i govorom). Sam je znanstvenik vjerovao da "lingvistika može biti korisna u bliskoj budućnosti samo ako se oslobodi obvezne veze s filologijom i poviješću književnosti". Fonologija je postala “poligon” za uvođenje matematičkih metoda u lingvistiku - glasovi kao “atomi” jezičnog sustava, s ograničenim brojem lako mjerljivih svojstava, bili su najprikladniji materijal za formalne, stroge metode opisa. Fonologija negira postojanje značenja u zvuku, pa je u istraživanju eliminiran “ljudski” faktor. U tom smislu, fonemi su poput fizičkih ili bioloških objekata.

Fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu sferu, zasebnu “fenomenološku stvarnost”. Na primjer, u Engleski jezik Glas "t" može se izgovoriti na različite načine, ali u svim slučajevima će ga osoba koja govori engleski percipirati kao "t". Glavno je da će fonem obavljati svoju glavnu - semantičko-razlikovnu - funkciju. Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" su različiti u engleskom, dok su u drugim jezicima varijacije istog fonema (poput engleskog "t", izgovara se aspirirano ili neaspirirano). Ogromni vokabular svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika predstavljaju sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, slijedeći Saussurea, Jacobson i N.S. Trubetskoy identificirali su "različite značajke" fonema. Ove značajke temelje se na građi govornih organa - jezika, zuba, glasnica. Recimo, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg lingvističkog pravila koje je opisao Saussure: "U jeziku postoje samo razlike." Ono što je važnije nije čak ni ovo: razlika obično podrazumijeva precizne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da smatramo "označavanjem" ili "označenim" - ne postoje koncepti ili glasovi u jeziku koji su postojali prije nego što se jezični sustav razvio.

Stoga se u saussureovskoj lingvistici fenomen koji se proučava shvaća kao skup usporedbi i kontrasta jezika. Jezik je i izraz značenja riječi i sredstvo komunikacije, a te se dvije funkcije nikad ne podudaraju. Možemo primijetiti izmjenu oblika i sadržaja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u morfeme, morfemi u riječi, riječi u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od zbroja svojih dijelova.

Saussure je predložio ideju nove znanosti dvadesetog stoljeća, odvojene od lingvistike, koja je proučavala ulogu znakova u društvu. Saussure je ovu znanost nazvao semiologijom (od grčkog “semeion” - znak). "Znanost" semiotike, koja se razvila u istočnoj Europi 1920-ih i 1930-ih te u Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili formulirana) pomoću tih struktura. Osim toga, u zalasku svoje karijere, paralelno s tečajem opće lingvistike, Saussure je započeo “semiotičku” analizu kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bila je to pokušaj da se u sustavu prouči problem "vjerojatnosti" u jeziku. Takvo istraživanje pomaže usredotočiti se na “materijalnu stranu” vjerojatnosti; “ključna riječ”, čiji anagram Saussure traži, kako tvrdi Jean Starobinsky, “oruđe za pjesnika, a ne izvor života pjesme”. Pjesma služi za preokretanje zvukova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure ne ulazi u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna želja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi stvaraju, ona nadilazi kontrolu svijesti i ovisi samo o zakonima jezika” (vidi . Prilog 1).

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji naglašava jednu od sastavnica njegove jezične analize – proizvoljnu prirodu znakova, kao i formalnu bit Saussureove lingvistike koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas Saussureovi radovi čine neobično dosljednima u svojoj nevoljkosti da proučavaju simbole fenomena koji imaju jasno definirano značenje [Dodatak 1]. Proučavajući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne varijante. . . . Proučavajući Nibelungenlied, on identificira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerni, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on sugerira postojanje semiologije koja opisuje više od pukih jezičnih znakova; ali ta je pretpostavka ograničena činjenicom da semiologija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti “namjeru” bez objekta; nije mogao do kraja prevladati jaz između forme i sadržaja – u njegovim se djelima to pretvorilo u pitanje. Umjesto toga, pozvao se na "jezičnu zakonitost". Smješten između, s jedne strane, devetnaestostoljetnih koncepata utemeljenih na povijesti i subjektivnom nagađanju, te metoda kontingentnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koji brišu suprotnost između forme i sadržaja (subjekt i objekt), značenje i podrijetlo u strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici - spisi Ferdinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i kulturi.

Ruski su znanstvenici također bili zastupljeni na Prvom međunarodnom kongresu lingvista u Haagu 1928. godine. S. Kartsevsky, R. Jacobson i N. Trubetskoy napravili su referat u kojem je razmatrana hijerarhijska struktura jezika - u duhu najsuvremenijih ideja s početka prošlog stoljeća. Jacobson je u svojim radovima razvijao Saussureove ideje da osnovne elemente jezika treba proučavati, prije svega, u vezi s njihovim funkcijama, a ne s razlozima njihova nastanka.

Nažalost, dolaskom Staljina na vlast 1924. domaće je jezikoslovlje, kao i mnoge druge znanosti, bačeno unazad. Mnogi talentirani znanstvenici bili su prisiljeni emigrirati, protjerani iz zemlje ili umrli u logorima. Tek od sredine 1950-ih postao je moguć neki pluralizam teorija - više o tome u odjeljku 1.2.

1.2 Primjena matematičkih metoda u lingvistici u drugoj polovici dvadesetog stoljeća

Do sredine dvadesetog stoljeća formirale su se četiri svjetske lingvističke škole, od kojih se svaka pokazala rodonačelnikom određene "egzaktne" metode. Lenjingradska fonološka škola(njegov utemeljitelj bio je učenik Baudouina de Courtenaya L.V. Shcherba) koristio je psiholingvistički eksperiment temeljen na analizi govora izvornih govornika kao glavni kriterij za generalizaciju zvuka u obliku fonema.

Znanstvenici Praški lingvistički krug, posebno - njegov osnivač N.S. Trubetskoy, koji je emigrirao iz Rusije, razvio je teoriju opozicija - semantičku strukturu jezika opisali su kao skup opozicijski izgrađenih semantičkih jedinica - seme. Ova se teorija koristila u proučavanju ne samo jezika, već i umjetničke kulture.

Ideolozi američki deskriptivizam bili su lingvisti L. Bloomfield i E. Sapir. Deskriptivistima je jezik predstavljen kao skup govornih iskaza koji su bili glavni predmet njihova istraživanja. Njihov fokus bio je na pravilima znanstvenog opisa (otuda i naziv) tekstova: proučavanje organizacije, rasporeda i klasifikacije njihovih elemenata. Formalizacija analitičkih postupaka u području fonologije i morfologije (razvoj načela za proučavanje jezika na različitim razinama, distribucijska analiza, metoda izravnih sastavnica itd.) dovela je do formuliranja općih pitanja jezičnog modeliranja. Zanemarivanje plana sadržaja jezika, kao i paradigmatske strane jezika, nije omogućilo deskriptivistima da u potpunosti protumače jezik kao sustav.

Šezdesetih godina 20. stoljeća razvila se teorija formalnih gramatika koja je nastala uglavnom zahvaljujući radovima američkog filozofa i lingvista N. Chomskog. S pravom se smatra jednim od najpoznatijih suvremenih znanstvenika i javnih osoba, posvećeni su mu mnogi članci, monografije, pa čak i cjelovečernji dokumentarni film. Nakon temeljno novog načina opisivanja sintaktičke strukture koji je izumio Chomsky - generativne (generativne) gramatike - odgovarajući pokret u lingvistici nazvan je generativizam.

Chomsky, potomak imigranata iz Rusije, studirao je lingvistiku, matematiku i filozofiju na Sveučilištu u Pennsylvaniji od 1945. godine, pod snažnim utjecajem svog učitelja Zeliga Harrisa - poput Harrisa, Chomsky je svoje političke stavove smatrao i smatra bliskim anarhizmu (još je poznat kao kritičar postojećeg američkog političkog sustava i kao jedan od duhovnih vođa antiglobalizma).

Chomskyjev prvi veliki znanstveni rad, njegov magistarski rad “Morfologija modernog hebrejskog » (1951), ostao neobjavljen. Chomsky je doktorirao na Sveučilištu u Pennsylvaniji 1955., no veliki dio istraživanja koji je činio temelj njegove disertacije (objavljene u cijelosti tek 1975. pod naslovom “Logična struktura lingvističke teorije”) i njegove prve monografije, “Sintaktička Strukture” (Sintaktičke strukture, 1957., rus. prev. 1962.), izvedena je na Sveučilištu Harvard 1951.-1955. Iste 1955. godine znanstvenik se preselio na Tehnološki institut u Massachusettsu, gdje je 1962. godine postao profesor.

U svom razvoju Chomskyjeva teorija prošla je kroz nekoliko faza.

U svojoj prvoj monografiji, "Sintaktičke strukture", znanstvenik je predstavio jezik kao mehanizam za generiranje beskonačnog broja rečenica pomoću konačnog skupa gramatičkih sredstava. Kako bi opisao jezična svojstva, predložio je koncepte dubokih (skrivenih od izravne percepcije i generiranih sustavom rekurzivnih, tj. pravila koja se mogu primjenjivati ​​više puta) i površinskih (izravno percipiranih) gramatičkih struktura, kao i transformacije koje opisuju prijelaz iz dubinskih struktura u površinske. Jedna duboka struktura može odgovarati nekoliko površinskih (na primjer, pasivna struktura Ukaz potpisuje predsjednik izveden iz iste dubinske strukture kao i aktivni konstrukt Predsjednik potpisuje ukaz) i obrnuto (dakle, dvosmislenost Majka voli kćer opisan kao rezultat podudarnosti površinskih struktura koje sežu u dvije različite dubinske, u jednoj od kojih je majka ona koja voli kćer, a u drugoj ona koju kćer voli).

Chomskyjeva standardna teorija je model aspekata, izložen u Chomskyjevoj knjizi Aspekti teorije sintakse. U ovom modelu, pravila semantičke interpretacije koja pripisuju značenje dubokim strukturama uvedena su u formalnu teoriju po prvi put. U “Aspektima” je jezična kompetencija suprotstavljena upotrebi jezika (izvedbi), usvojena je tzv. Katz-Postalova hipoteza o očuvanju značenja tijekom transformacije, pa je stoga isključen koncept neobvezne transformacije, a aparatura uvode se sintaktička obilježja koja opisuju leksičku spojivost.

Sedamdesetih godina prošlog stoljeća Chomsky je radio na teoriji kontrole i vezivanja (GB-teorija - od riječi vlada I vezanje) - općenitiji od prethodnog. U njemu je znanstvenik napustio određena pravila koja opisuju sintaktičke strukture određenih jezika. Sve transformacije zamijenjene su jednom univerzalnom transformacijom poteza. U okviru GB teorije postoje i privatni moduli od kojih je svaki odgovoran za svoj dio gramatike.

Još 1995. Chomsky je iznio minimalistički program u kojem je ljudski jezik opisan kao sličan strojnom jeziku. Ovo je samo program - ne model ili teorija. U njemu Chomsky identificira dva glavna podsustava ljudskog jezičnog aparata: leksikon i računalni sustav, kao i dva sučelja - fonetsko i logičko.

Chomskyjeve formalne gramatike postale su klasične za opisivanje ne samo prirodnih, već i umjetnih jezika - posebno programskih jezika. Razvoj strukturalne lingvistike u drugoj polovici dvadesetog stoljeća s pravom se može smatrati “Chomskyjevom revolucijom”.

Moskovska fonološka škola, čiji su predstavnici bili A.A. Reformatsky, V.N. Sidorov, P.S. Kuznjecov, A.M. Suhotin, R.I. Avanesov, koristio je sličnu teoriju za proučavanje fonetike. Postupno se "točne" metode počinju primjenjivati ​​ne samo na fonetiku, već i na sintaksu. I lingvisti i matematičari, kod nas i u inozemstvu, počinju proučavati strukturu jezika. U 1950-60-ima u SSSR-u je započela nova faza u interakciji matematike i lingvistike, povezana s razvojem sustava za strojno prevođenje.

Poticaj za početak ovog rada u našoj zemlji bila su prva dostignuća u području strojnog prevođenja u SAD-u (iako je prvi uređaj za mehanizirano prevođenje P.P. Smirnov-Troyansky izumljen u SSSR-u još 1933. godine, on je, budući da je primitivan, nije postalo široko rasprostranjeno). Godine 1947. A. Butt i D. Britten smislili su kod za prijevod riječ po riječ pomoću računala, a godinu dana kasnije R. Richens predložio je pravilo za dijeljenje riječi na korijene i završetke u strojnom prijevodu. Te su godine bile dosta drugačije od modernih. Bili su to vrlo veliki i skupi strojevi koji su zauzimali cijele prostorije i zahtijevali veliki broj inženjera, operatera i programera za njihovo održavanje. Uglavnom, ta su računala služila za izvođenje matematičkih proračuna za potrebe vojnih institucija - novosti u matematici, fizici i tehnici služile su, prije svega, vojnim poslovima. U ranim fazama razvoj MP-a aktivno je podržavala vojska, pri čemu se (u uvjetima Hladnog rata) u SAD-u razvio rusko-engleski smjer, a u SSSR-u anglo-ruski.

U siječnju 1954. u Massachusettsu tehničko sveučilište Održan je “Georgetownski eksperiment” - prva javna demonstracija prijevoda s ruskog na engleski na stroju IBM-701. Sažetak poruke o uspješnom završetku eksperimenta, napravio D.Yu. Panov, pojavio se u Russian Journal of Mathematics, 1954., br. 10: “Prijevod s jednog jezika na drugi pomoću stroja: izvješće o prvom uspješnom testu.”

D. Yu. Panov (u to vrijeme direktor Instituta za znanstvene informacije - INI, kasnije VINITI) privukao je I. K. Belskaya da radi na strojnom prevođenju, koji će kasnije voditi grupu za strojno prevođenje na Institutu za preciznu matematiku i računalne znanosti Sveučilišta u Zagrebu. Akademija znanosti SSSR-a. Prvo iskustvo prevođenja s engleskog na ruski pomoću stroja BESM datira iz 1955. godine. Programe za BESM sastavio je N.P. Trifonov i L.N. Korolev, čija je doktorska disertacija bila posvećena metodama za izradu rječnika za strojno prevođenje.

Paralelno se radilo na strojnom prevođenju u Odjelu za primijenjenu matematiku Matematičkog instituta Akademije znanosti SSSR-a (sada Institut za primijenjenu matematiku M.V. Keldysh Ruske akademije znanosti). Na inicijativu matematičara A.A. Ljapunova. U rad na prevođenju tekstova pomoću stroja Strela s francuskog na ruski uključio je studenta diplomskog studija Matematičkog instituta Steklov O.S. Kulagin i njegovi učenici T.D. Ventzel i N.N. Ricco. Ideje Ljapunova i Kulagine o mogućnosti korištenja tehnologije za prevođenje s jednog jezika na drugi objavljene su u časopisu Nature, 1955., br. 8. Od kraja 1955. godine pridružili su im se T.N. Moloshnaya, koji je tada započeo samostalan rad na algoritmu za englesko-ruski prijevod.

R. Frumkina, koja se u to vrijeme bavila algoritamskim prijevodom sa španjolskog, prisjeća se da je u ovoj fazi rada bilo teško poduzeti bilo kakve dosljedne korake. Puno češće sam morao slijediti heurističko iskustvo - vlastito ili iskustvo svojih kolega.

Međutim, prva generacija sustava za strojno prevođenje bila je vrlo nesavršena. Svi su se temeljili na algoritmima konsekutivnog prevođenja "riječ po riječ", "fraza po fraza" - semantičke veze između riječi i rečenica nisu ni na koji način uzete u obzir. Na primjer, mogu se dati sljedeće rečenice: " John je tražio svoju kutiju za igračke.Napokon ga je pronašao. Kutija je bila u olovci.John je bio jako sretan. (John je tražio svoju kutiju za igračke. Napokon ju je našao. Kutija je bila u igralištu. John je bio jako sretan.)” "Olovka" u ovom kontekstu nije "olovka" (pisaći instrument), već "ogradica za igru" ( olovka za igru). Poznavanje sinonima, antonija i figurativnih značenja teško je unijeti u računalo. Smjer koji obećava bio je razvoj strojnih sustava namijenjenih ljudskom prevoditelju.

S vremenom su izravni sustavi prevođenja zamijenjeni T-sustavima (od engleske riječi "transfer" - transformacija), u kojima se prijevod provodio na razini sintaktičkih struktura. Algoritmi T-sustava koristili su mehanizam koji im je omogućio da izgrade sintaktičku strukturu prema pravilima gramatike jezika ulazne rečenice (slično kao što uče strani jezik u srednjoj školi), a zatim sintetiziraju izlaznu rečenicu, preoblikovanje sintaktičke strukture i zamjena potrebnih riječi iz rječnika.

Ljapunov je govorio o prijevodu izvlačenjem značenja prevedenog teksta i njegovim predstavljanjem na drugom jeziku. Pristup izgradnji sustava za strojno prevođenje koji se temelji na dobivanju semantičke reprezentacije ulazne rečenice njezinom semantičkom analizom i sintezom ulazne rečenice na temelju rezultirajuće semantičke reprezentacije još uvijek se smatra najnaprednijim. Takvi se sustavi nazivaju I-sustavi (od riječi "interlingua"). Istodobno, zadatak njihovog stvaranja, postavljen kasnih 50-ih - ranih 60-ih, još nije u potpunosti riješen, unatoč naporima Međunarodne federacije IFIP - globalne zajednice znanstvenika u području obrade informacija.

Znanstvenici su razmišljali o tome kako formalizirati i izgraditi algoritme za rad s tekstovima, koje rječnike treba unijeti u stroj, koje lingvističke obrasce treba koristiti u strojnom prevođenju. Tradicionalna lingvistika nije imala takve ideje – ne samo u smislu semantike, nego ni u smislu sintakse. Ni za jedan jezik u to vrijeme nije bilo popisa sintaktičkih struktura, nisu proučavani uvjeti njihove kompatibilnosti i zamjenjivosti, a nisu razvijena pravila za izgradnju velikih jedinica sintaktičke strukture od manjih sastavnih elemenata.

Potreba za stvaranjem teorijskih temelja za strojno prevođenje dovela je do nastanka i razvoja matematičke lingvistike. Vodeću ulogu u ovom pitanju u SSSR-u igrali su matematičari A.A. Ljapunov, O.S. Kulagina, V.A. Uspenski, lingvisti V.Yu. Rosenzweig, P.S. Kuznjecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulagina je disertacija bila posvećena proučavanju formalne teorije gramatika (istodobno s N. Chomskim u SAD-u), Kuznjecov je iznio problem aksiomatizacije lingvistike, vraćajući se na radove F.F. Fortunatova.

Dana 6. svibnja 1960. godine usvojena je Rezolucija Prezidija Akademije znanosti SSSR-a „O razvoju strukturnih i matematičkih metoda istraživanja jezika“, au Institutu za lingvistiku i Institutu za ruski jezik osnovani su odgovarajući odjeli. Od 1960. vodeća humanitarna sveučilišta u zemlji - Filološki fakultet Moskovskog državnog sveučilišta, Lenjinrad, Novosibirska sveučilišta, Moskovski državni pedagoški institut stranih jezika - započela su obuku osoblja u području automatske obrade teksta.

Istodobno, rad na strojnom prevođenju ovog razdoblja, nazvanog "klasičnim", više je od teorijskog nego praktičnog interesa. Isplativi sustavi za strojno prevođenje počeli su se stvarati tek osamdesetih godina prošlog stoljeća. O tome ću govoriti kasnije, u odjeljku 2.1, “Strojno prevođenje”.

1960-ih i 70-ih godina uključivalo je duboki teorijski razvoj koristeći metode teorije skupova i matematičke logike, kao što su teorija polja i teorija neizrazitih skupova.

Autor teorije polja u lingvistici bio je sovjetski pjesnik, prevoditelj i lingvist V.G. Opominjanje. Svoju je teoriju u početku razvio na temelju njemačkog jezika. U Admoniju koncept “polja” označava proizvoljan neprazan skup jezičnih elemenata (na primjer, “leksičko polje”, “semantičko polje”).

Struktura polja je heterogena: sastoji se od jezgre, čiji elementi imaju pun skup karakteristika koje definiraju skup, i periferije, čiji elementi mogu imati obje karakteristike danog skupa (ne sve) i susjednih. Dopustite mi da dam primjer da ilustriram ovu tvrdnju: recimo, u engleskom jeziku, polje složenih riječi ("day-dream" - "dream" teško je odvojiti od polja fraza ("tear gas" - "tear gas")) .

Već spomenuta teorija neizrazitih skupova usko je povezana s teorijom polja. U SSSR-u su njegovo utemeljenje proveli lingvisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, ali njezin je utemeljitelj američki matematičar L. Zade, koji je 1965. godine objavio članak “Fuzzy Logic”. Dajući matematičko opravdanje za teoriju neizrazitih skupova, Zadeh ih je razmatrao koristeći se lingvističkim materijalom.

U ovoj teoriji ne govorimo toliko o pripadnosti elemenata danom skupu (Aa), koliko o stupnju tog članstva (Aa), budući da periferni elementi mogu, u jednom ili drugom stupnju, pripadati nekoliko polja. Zade (Lofti-zade) je bio porijeklom iz Azerbejdžana, do svoje 12. godine imao je praksu komuniciranja na četiri jezika - azerbejdžanskom, ruskom, engleskom i perzijskom - i koristio je tri različita pisma: ćirilicu, latinicu, arapski. Kada znanstvenika pitaju što je zajedničko teoriji neizrazitih skupova i lingvistici, on ne poriče tu vezu, ali pojašnjava: “Nisam siguran da je proučavanje ovih jezika imalo veliki utjecaj na moje razmišljanje. Ako se to dogodilo, možda je bilo podsvjesno.” Zadeh je u mladosti studirao u Teheranu u prezbiterijanskoj školi, a nakon Drugog svjetskog rata emigrirao je u SAD. “Nije pitanje jesam li Amerikanac, Rus, Azerbajdžanac ili netko treći”, rekao je u jednom od razgovora, “formirale su me sve te kulture i narodi i među svakim od njih se osjećam sasvim ugodno.” U tim riječima postoji nešto slično onome što karakterizira teoriju neizrazitih skupova - odmak od jednoznačnih definicija i oštrih kategorija.

Kod nas su se 70-ih godina prevodila i proučavala djela zapadnih lingvista 20. stoljeća. I.A. Melchuk je preveo djela N. Chomskog na ruski. NA. Slyusareva u svojoj knjizi “Teorija F. de Saussurea u svjetlu moderne lingvistike” povezuje postavke Saussureova učenja s aktualnim problemima lingvistike 70-ih godina. Pojavljuje se trend daljnje matematizacije lingvistike. Vodeća domaća sveučilišta pružaju obuku u specijalnosti "Matematička (teorijska, primijenjena) lingvistika." Istodobno se na Zapadu događa nagli skok u razvoju računalne tehnologije, koja zahtijeva sve više novih jezičnih temelja.

U 1980-ima, profesor na Institutu za orijentalne studije Akademije znanosti Yu.K. Lekomtsev, analizirajući jezik lingvistike analizom dijagrama, tablica i drugih vrsta zapisa koji se koriste u lingvističkim opisima, smatra matematičke sustave prikladne za te svrhe (uglavnom sustave matrične algebre).

Tako je kroz dvadeseto stoljeće došlo do konvergencije egzaktnih i humanističkih znanosti. Interakcija matematike s lingvistikom sve je više nalazila praktičnu primjenu. Više o tome u sljedećem poglavlju.

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1 Strojno prevođenje

Ideja o prevođenju s jednog jezika na drugi pomoću univerzalnog mehanizma pojavila se nekoliko stoljeća ranije nego što su započeli prvi razvoji na ovom polju - davne 1649. Rene Descartes predložio je ideju jezika u kojem su ekvivalentne ideje različitih jezika bila bi izražena jednim simbolom. Prvi pokušaji provedbe te ideje u 1930-im i 40-im godinama, početak teorijskih razvoja sredinom stoljeća, usavršavanje prevoditeljskih sustava uz pomoć tehnologije u 1970-im i 80-im godinama, nagli razvoj prevoditeljske tehnologije u posljednjoj desetljeće - to su faze u razvoju strojnog prevođenja kao industrije. Iz rada na strojnom prevođenju računalna je lingvistika izrasla kao znanost.

S razvojem računalne tehnologije kasnih 70-ih i ranih 80-ih, istraživači su sebi postavili realnije i isplativije ciljeve - stroj nije postao konkurent (kao što se prije pretpostavljalo), već pomoćnik ljudskom prevoditelju. Strojno prevođenje prestaje služiti isključivo u vojne svrhe (svi sovjetski i američki izumi i istraživanja, usredotočeni prvenstveno na ruski i engleski jezik, pridonijeli su Hladnom ratu u ovoj ili onoj mjeri). Godine 1978. preko mreže Arpa prenošene su riječi prirodnog jezika, a šest godina kasnije prvi prevoditeljski programi za mikroračunala pojavili su se u SAD-u.

U 70-ima je Komisija europskih zajednica kupila englesko-francusku verziju računalnog prevoditelja Systran, naručivši i francusko-englesku i talijansko-englesku verziju te rusko-engleski sustav prevođenja koji koriste američke oružane snage. Tako su postavljeni temelji projekta EUROTRA.

O oživljavanju strojnog prevođenja 70-80-ih. Sljedeće činjenice pokazuju: Komisija europskih zajednica (CEC) kupuje englesko-francusku verziju Systrana, kao i sustav prevođenja s ruskog na engleski (potonji je razvijen nakon izvješća ALPAC-a i nastavio ga je koristiti US Air Force i NASA); osim toga, CEC naručuje izradu francusko-engleske i talijansko-engleske verzije. U isto vrijeme dolazi do brzog širenja aktivnosti stvaranja sustava za strojno prevođenje u Japanu; u SAD-u Panamerička zdravstvena organizacija (PAHO) naređuje razvoj španjolsko-engleskog smjera (sustav SPANAM); Zračne snage SAD-a financiraju razvoj sustava za strojno prevođenje u Lingvističkom istraživačkom centru na Sveučilištu Texas u Austinu; Grupa TAUM u Kanadi značajno napreduje u razvoju svog sustava METEO (za prijevod vremenskih izvješća). Brojni projekti započeti su 70-80-ih. kasnije razvijen u potpune komercijalne sustave.

U razdoblju od 1978. do 1993. godine Sjedinjene Države potrošile su 20 milijuna dolara na istraživanja u području strojnog prevođenja, 70 milijuna u Europi i 200 milijuna u Japanu.

Jedna od novosti je tehnologija TM (translation memory) koja radi na principu akumulacije: tijekom procesa prevođenja spremaju se izvorni segment (rečenica) i njezin prijevod, što rezultira formiranjem jezične baze podataka; Ako se u novoprevedenom tekstu pronađe identičan ili sličan segment izvorniku, on se prikazuje zajedno s prijevodom i naznakom postotka podudaranja. Prevoditelj zatim donosi odluku (urediti, odbiti ili prihvatiti prijevod), čiji rezultat sustav pohranjuje, tako da nema potrebe dvaput prevoditi istu rečenicu. Trenutno, razvijač poznatog komercijalnog sustava temeljenog na TM tehnologiji je sustav TRADOS (osnovan 1984.).

Trenutačno nekoliko desetaka tvrtki razvija komercijalne sustave strojnog prevođenja, uključujući: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata softver; Lingvistica b.v. itd. Sada je moguće koristiti usluge automatskih prevoditelja izravno na webu: alphaWorks; PROMT-ov mrežni prevoditelj; LogoMedia.net; AltaVistina usluga prevođenja Babel Fish; InfiniT.com; Prevođenje Interneta.

Komercijalno učinkoviti sustavi prevođenja pojavili su se u drugoj polovici 80-ih u našoj zemlji. Proširio se i sam koncept strojnog prevođenja (počeo je uključivati ​​“stvaranje više automatskih i automatiziranih sustava i uređaja koji automatski ili poluautomatski obavljaju cijeli ciklus prevođenja ili pojedine zadatke u dijalogu s osobom”), te povećana su državna izdvajanja za razvoj ove industrije.

Glavni jezici domaćih sustava prevođenja su ruski, engleski, njemački, francuski i japanski. Svesavezni centar za prevođenje (VTsP) razvio je sustav za prevođenje s engleskog i njemačkog na ruski na računalu EC-1035-ANRPP. Sastojao se od tri rječnika - ulaznog engleskog i njemačkog i izlaznog ruskog - pod jednim softverom. Bilo je nekoliko izmjenjivih specijaliziranih rječnika - o računalnoj tehnologiji, programiranju, radioelektronici, strojarstvu, poljoprivredi, metalurgiji. Sustav je mogao raditi u dva načina - automatskom i interaktivnom, kada je na ekranu prikazivan izvorni tekst i prijevod, frazu po frazu, koje je osoba mogla uređivati. Brzina prevođenja teksta u ANRAP (od početka upisivanja do kraja ispisa) bila je približno 100 stranica na sat.

Godine 1989. stvorena je obitelj komercijalnih prevoditelja kao što je SPRINT, koji rade s ruskim, engleskim, njemačkim i japanskim jezikom. Njihova glavna prednost bila je njihova kompatibilnost s IBM PC-jem - čime su postignuti domaći sustavi strojnog prevođenja međunarodnoj razini kvaliteta. Istodobno se razvija sustav strojnog prevođenja s francuskog na ruski FRAP, koji uključuje 4 stupnja analize teksta: grafematski, morfološki, sintaktički i semantički. U Lenjingradskom državnom pedagoškom institutu nazvanom po. Herzen je radio na četverojezičnom (engleski, francuski, španjolski, ruski) sustavu SILOD-MP (u industrijskom načinu rada korišteni su englesko-ruski i francusko-ruski rječnici).

Za specijalizirano prevođenje tekstova iz elektrotehnike postojao je sustav ETAP-2. Analiza ulaznog teksta u njoj provedena je na dvije razine - morfološkoj i sintaktičkoj. Rječnik ETAP-2 sadržavao je oko 4 tisuće natuknica; faza transformacije teksta - oko 1000 pravila (96 općih, 342 privatna, ostalo su rječnička). Sve je to osiguralo zadovoljavajuću kvalitetu prijevoda (primjerice, naslov patenta “Optical phase grid arrangement and coupling device having such an arrangement” preveden je kao “Optical фазni grid raspored i uređaj za spajanje na takav uređaj” - unatoč tautologiji, značenje je sačuvano).

Na Pedagoškom institutu za strane jezike u Minsku osmišljen je sustav za strojno prevođenje naslova na temelju englesko-ruskog rječnika oblika riječi i fraza), a na Institutu za orijentalne studije Akademije znanosti sustav za prevođenje s japanskog na ruski je izmišljen. Prvi automatski rječničko-terminološki servis (SLOTERM) za računalnu tehnologiju i programiranje, stvoren u Moskovskom istraživačkom institutu za sustave automatizacije, sadržavao je približno 20 000 pojmova u rječniku objašnjenja i posebnim rječnicima za lingvistička istraživanja.

Sustavi za strojno prevođenje postupno su se počeli koristiti ne samo za namjeravanu svrhu, već i kao važna komponenta sustava za automatsko učenje (za podučavanje prevođenja, praćenje pravopisnog i gramatičkog znanja).

Devedesete su sa sobom donijele brzi razvoj tržišta osobnih računala (od stolnih do džepnih) i informacijske tehnologije te raširenu upotrebu Interneta (koji postaje sve više internacionalan i višejezičan). Sve je to učinilo daljnji razvoj sustava za automatizirano prevođenje zahtjevnim. Od ranih 1990-ih. Na tržište PC sustava ulaze i domaći programeri.

U srpnju 1990., na izložbi PC Forum u Moskvi, predstavljen je prvi ruski komercijalni sustav za strojno prevođenje pod nazivom PROMT (PROgrammer's Machine Translation). Godine 1991., JSC [!!!] je stvoren u skladu sa Saveznim zakonom-99 od 05.05. 2014. ovaj oblik je zamijenjen nejavnim dioničkim društvom] "PROMT MT", a već 1992. tvrtka PROMT pobjeđuje na natječaju NASA-e za nabavu MP sustava (PROMT je bio jedina neamerička tvrtka na ovom natječaju) Godine 1992. "PROMT" proizvodi cijelu obitelj sustava pod novim imenom STYLUS za prijevod s engleskog, njemačkog, francuskog, talijanskog i španjolskog na ruski i s ruskog na engleski jezik, a 1993. godine, na temelju STYLUS-a, prvi stroj u svijetu stvoren je sustav za prevođenje za Windows, izdana je verzija STYLUS 2.0 za Windows 3.X/95/NT, a 1995.-1996. predstavljena je treća generacija sustava za strojno prevođenje, potpuno 32-bitni STYLUS 3.0 za Windows 95/NT, u isto vrijeme razvoj potpuno novih, prvih u svijetu rusko-njemačkih i rusko-francuskih sustava strojnog prevođenja.

Godine 1997. potpisan je ugovor s francuskom tvrtkom Softissimo za izradu sustava prevođenja s francuskog na njemački i engleski i obrnuto, au prosincu ove godine pušten je u prodaju prvi njemačko-francuski sustav prevođenja na svijetu. Iste godine tvrtka PROMT izdala je sustav implementiran pomoću Gigant tehnologije, podržavajući nekoliko jezičnih smjerova u jednoj ljusci, kao i poseban prevoditelj za rad na Internetu, WebTranSite.

Godine 1998. puštena je cijela plejada programa pod novim imenom PROMT 98. Godinu dana kasnije tvrtka PROMT izdala je dva nova proizvoda: jedinstveni programski paket za rad na Internetu - PROMT Internet i prevoditelj za korporativne mail sustave - PROMT Mail Translator. U studenom 1999. PROMT je prepoznat kao najbolji sustav za strojno prevođenje među onima koje je testirao francuski časopis PC Expert, nadmašivši svoje konkurente u pogledu ukupnih pokazatelja za 30 posto. Za korporativne klijente razvijena su i posebna poslužiteljska rješenja - korporativni prevoditeljski poslužitelj PROMT Translation Server (PTS) i internetsko rješenje PROMT Internet Translation Server (PITS). Godine 2000. PROMT je ažurirao svoju cjelokupnu liniju softverskih proizvoda, izdajući novu generaciju MP sustava: PROMT Translation Office 2000, PROMT Internet 2000 i Magic Gooddy 2000.

Online prijevod uz podršku sustava PROMT koristi se na brojnim domaćim i stranim stranicama: PROMT-ov Online Translator, InfiniT.com, Translate.Ru, Lycos itd., kao iu ustanovama raznih profila za prevođenje poslovnih dokumentacija, članci i pisma (postoje sustavi za prevođenje ugrađeni izravno u Outlook Express i druge klijente e-pošte).

Danas se pojavljuju nove tehnologije strojnog prevođenja koje se temelje na korištenju sustava umjetna inteligencija, statističke metode. O potonjem se govori u sljedećem odjeljku.

2.2 Statističarznanstvene metode u učenju jezika

Znatna se pozornost u suvremenoj lingvistici posvećuje proučavanju jezičnih pojava pomoću metoda kvantitativne matematike. Kvantitativni podaci često pomažu dubljem razumijevanju fenomena koji se proučavaju, njihovog mjesta i uloge u sustavu povezanih fenomena. Odgovor na pitanje "koliko" pomaže odgovoriti na pitanja "što", "kako", "zašto" - to je heuristički potencijal kvantitativnih karakteristika.

Statističke metode igraju značajnu ulogu u razvoju sustava za strojno prevođenje (vidi odjeljak 2.1). U statističkom pristupu problem prevođenja razmatra se u smislu kanala s šumom. Zamislimo da trebamo prevesti rečenicu s engleskog na ruski. Načelo kanala buke nudi nam sljedeće objašnjenje odnosa između engleske i ruske fraze: engleska rečenica nije ništa više od ruske rečenice iskrivljene nekim šumom. Kako bismo rekonstruirali izvornu rusku rečenicu, moramo znati što točno ljudi obično govore na ruskom i kako se ruske fraze iskrivljuju na engleski. Prijevod se provodi traženjem ruske rečenice koja maksimizira umnožak bezuvjetne vjerojatnosti ruske rečenice i vjerojatnosti engleske rečenice (izvornika) s obzirom na danu rusku rečenicu. Prema Bayesovom teoremu, ova je ruska rečenica najvjerojatniji prijevod engleskog:

gdje je e prijevodna rečenica, a f izvorna rečenica

Dakle, trebamo model izvora i model kanala, ili model jezika i model prijevoda. Jezični model trebao bi dodijeliti ocjenu vjerojatnosti bilo kojoj rečenici ciljanog jezika (u našem slučaju ruskog), a model prijevoda trebao bi dodijeliti ocjenu vjerojatnosti izvornoj rečenici. (vidi tablicu 1)

Općenito, sustav strojnog prevođenja radi na dva načina:

1. Obuka sustava: uzima se korpus za obuku paralelnih tekstova i pomoću linearnog programiranja traže se vrijednosti tablica korespondencije prijevoda koje maksimiziraju vjerojatnost (na primjer) ruskog dijela korpusa s obzirom na postojeći engleski dio prema odabranom modelu prijevoda. Na ruskom dijelu istog korpusa izgrađen je model ruskog jezika.

2. Operacija: na temelju dobivenih podataka, u ruskoj se rečenici traži nepoznata engleska rečenica koja maksimizira umnožak vjerojatnosti dodijeljenih jezičnim modelom i prevoditeljskim modelom. Program koji se koristi za ovu pretragu naziva se dekriptor.

Najjednostavniji statistički model prevođenja je model doslovnog prevođenja. U ovom modelu pretpostavlja se da je za prijevod rečenice s jednog jezika na drugi dovoljno prevesti sve riječi (kako bi se stvorila “vreća riječi”), a njihov raspored u ispravnom redoslijedu osigurat će model Da bi se P(a, f | e) sveo na P(a | e, f), tj. vjerojatnosti danog poravnanja za dani par rečenica, svaka vjerojatnost P(a, f | e) je normalizirana zbrojem vjerojatnosti svih poravnanja danog para rečenica:

Implementacija Viterbijevog algoritma korištenog za treniranje Modela br. 1 je sljedeća:

1. Cijela tablica vjerojatnosti korespondencije prijevoda ispunjena je istim vrijednostima.

2. Za sve moguće varijante parnih veza riječi izračunava se vjerojatnost P(a, f | e):

3. Vrijednosti P(a, f | e) su normalizirane kako bi se dobile vrijednosti P(a | e, f).

4. Izračunava se učestalost svakog para prijenosa, ponderirana vjerojatnošću svake opcije usklađivanja.

5. Rezultirajuće ponderirane frekvencije se normaliziraju i formira se nova tablica vjerojatnosti korespondencije prijevoda

6. Algoritam se ponavlja od koraka 2.

Razmotrimo, kao primjer, uvježbavanje sličnog modela na korpusu od dva para rečenica (slika 2):

bijela kuća

Nakon velikog broja iteracija dobivamo tablicu (tablica 2) iz koje je vidljivo da je prijevod izveden s visokom točnošću.

Također, statističke metode naširoko se koriste u proučavanju vokabulara, morfologije, sintakse i stilistike. Znanstvenici s Državnog sveučilišta u Permu proveli su istraživanje temeljeno na tvrdnji da su stereotipne kombinacije riječi važan “ gradevinski materijal»tekst. Ove se fraze sastoje od "osnovnih" riječi koje se ponavljaju i zavisnih konkretizirajućih riječi i imaju izraženu stilsku boju.

U znanstvenom stilu, "nuklearne" riječi mogu se nazvati: istraživanje, studija, zadatak, problem, pitanje, fenomen, činjenica, opažanje, analiza itd. U novinarstvu, "nuklearne" riječi bit će druge riječi koje imaju povećanu vrijednost posebno za tekst novina: vrijeme, osoba, moć, materija, djelovanje, zakon, život, povijest, mjesto itd. (ukupno 29)

Od posebnog interesa za jezikoslovce je i stručna diferencijacija nacionalnog jezika te jedinstvena uporaba vokabulara i gramatike ovisno o vrsti zanimanja. Poznato je da vozači u stručnom govoru koriste oblik sh O fer, liječnici razgovaraju s O Klush umjesto Cockle Yu w - mogu se dati slični primjeri. Zadaća je statistike pratiti varijabilnost izgovora i promjene jezične norme.

Profesionalne razlike dovode do ne samo gramatičkih, već i leksičkih razlika. Na Jakutskom državnom sveučilištu nazvanom po. M.K. Ammosov je analizirao 50 upitnika s najčešćim reakcijama na pojedine riječi među liječnicima i građevinarima (tablica 3).

Graditelji

ljudski

pacijent (10), osobnost (5)

muškarac (5)

dobro

pomoć (8), pomoć (7)

zlo (16)

život

smrt (10)

lijepa (5)

smrt

leš (8)

život (6)

vatra

toplina (8), spaljivanje (6)

vatra (7)

prst

ruka (14), zločinac (5)

palac (7), indeks (6)

oči

vid (6), učenik, oftalmolog (po 5)

smeđa (10), velika (6)

glava

um (14), mozak (5)

velik (9), pametan (8), pametan (6)

izgubiti

svijest, život (po 4)

novac (5), pronađi (4)

Može se uočiti da liječnici češće od građevinara daju asocijacije vezane uz svoju profesionalnu djelatnost, budući da poticajne riječi dane u upitniku imaju više veze s njihovom profesijom nego sa profesijom građevinara.

Statistički obrasci u jeziku koriste se za izradu frekvencijskih rječnika - rječnika koji daju numeričke karakteristike učestalosti riječi (oblika riječi, izraza) bilo kojeg jezika - jezika pisca, djela itd. Obično se učestalost pojavljivanja Riječ se koristi kao karakteristika učestalosti u tekstu određene duljine

Model percepcije govora nemoguć je bez rječnika kao svoje najvažnije komponente. Pri percipiranju govora glavna operativna jedinica je riječ. Iz toga posebice proizlazi da se svaka riječ percipiranog teksta mora identificirati s odgovarajućom jedinicom unutarnjeg vokabulara slušatelja (ili čitatelja). Prirodno je pretpostaviti da je pretraživanje od samog početka ograničeno na određena podpodručja rječnika. Prema većini suvremenih teorija percepcije govora, stvarna fonetska analiza zvučnog teksta u tipičnom slučaju daje samo neke djelomične informacije o mogućem fonološkom izgledu riječi, a na tu vrstu informacija ne odgovara jedan, već određeni MNOGO riječi u rječniku; Stoga se javljaju dva problema:

(a) odabrati odgovarajući skup prema određenim parametrima;

(b) unutar zacrtanog skupa (ako je adekvatno odabran), “isključiti” sve riječi osim one jedine koja najbolje odgovara danoj riječi prepoznatog teksta. Jedna od strategija skrininga je eliminacija niskofrekventnih riječi. Iz toga slijedi da je rječnik za percepciju govora frekvencijski rječnik. Upravo je izrada računalne verzije frekvencijskog rječnika ruskog jezika početni zadatak predstavljenog projekta.

Postoji 5 frekvencijskih rječnika temeljenih na ruskom jeziku (ne računajući industrijske). Napomenimo samo neke općenite nedostatke postojećih rječnika.

Svi poznati frekvencijski rječnici ruskog jezika izgrađeni su na obradi nizova pisanih (tiskanih) tekstova. Djelomično iz tog razloga, kada se identitet riječi uglavnom temelji na formalnoj, grafičkoj slučajnosti, semantika se ne uzima dovoljno u obzir. Kao rezultat toga, karakteristike frekvencije su pomaknute i iskrivljene; na primjer, ako sastavljač frekventnog rječnika u opću statistiku uporabe riječi "prijatelj" uključi riječi iz kombinacije "jedni druge", onda je to teško opravdano: uzimajući u obzir semantiku, moramo priznati da su ti već su različite riječi, odnosno da su samostalna rječnička jedinica samo sama kombinacija u cjelini.

Također, u svim postojećim rječnicima riječi se stavljaju samo u osnovnim oblicima: imenice u jednini, nominativu, glagoli u infinitivu itd. Neki rječnici daju podatke o učestalosti oblika riječi, ali obično to čine nedovoljno dosljedno i neiscrpno. Frekvencije različitih oblika riječi iste riječi očito se ne podudaraju. Kreator modela percepcije govora mora uzeti u obzir da je u stvarnom perceptivnom procesu predmet prepoznavanja određeni oblik riječi „uronjen“ u tekst: na temelju analize početnog dijela eksponenta oblika riječi, nastaje mnogo riječi s identičnim početkom, a početni dio oblika riječi nije nužno identičan početnom dijelu rječničkog oblika. Oblik riječi ima specifičnu ritmičku strukturu - također izuzetno važan parametar za perceptivni odabir riječi. Konačno, u konačnom prikazu prepoznatog iskaza, riječi su ponovno predstavljene odgovarajućim oblicima riječi.

Mnogo je radova koji pokazuju važnost frekvencije u procesu percepcije govora. No, nije nam poznato niti jedno djelo koje koristi učestalost oblika riječi – naprotiv, svi autori praktički zanemaruju učestalost pojedinih oblika riječi, okrećući se isključivo leksemima. Ako se dobiveni rezultati ne smatraju artefaktima, moramo pretpostaviti da izvorni govornik na neki način ima pristup informacijama o odnosu između učestalosti oblika riječi i oblika rječnika, tj. zapravo leksema. Štoviše, ovakav prijelaz iz oblika riječi u leksem, naravno, ne može se objasniti prirodnim poznavanjem odgovarajuće paradigme, jer se informacija o učestalosti mora koristiti prije konačne identifikacije riječi, inače ona jednostavno gubi svoje značenje.

Na temelju primarnih statističkih obilježja moguće je uz zadanu relativnu pogrešku odrediti onaj dio vokabulara koji uključuje riječi s visokom učestalošću pojavljivanja, neovisno o vrsti teksta. Također je moguće, uvođenjem postupnog sređivanja u rječnik, dobiti niz rječnika koji pokriva prvih 100, 1000, 5000 itd. čestih riječi. Statističke karakteristike rječnika zanimljive su u vezi sa semantičkom analizom vokabulara. Proučavanje predmetno-ideoloških skupina i semantičkih polja pokazuje da su leksičke asocijacije poduprte semantičkim vezama koje su koncentrirane oko leksema s najopćenitijim značenjem. Opis značenja unutar leksičko-semantičkog polja može se provesti identificiranjem riječi s najapstraktnijim leksemima. Naizgled, “prazne” (sa stajališta nominativne potencije) rječničke jedinice čine statistički homogen sloj.

Ništa manje nisu vrijedni ni rječnici za pojedine žanrove. Proučavanje mjere njihove sličnosti i prirode statističkih distribucija pružit će zanimljive podatke o kvalitativnoj stratifikaciji vokabulara ovisno o sferi govorne uporabe.

Sastavljanje rječnika velike frekvencije zahtijeva korištenje računalne tehnologije. UVOĐENJE djelomične mehanizacije i automatizacije u proces rada na rječniku zanimljivo je kao eksperiment strojne obrade rječnika za različite tekstove. Takav rječnik zahtijeva strožiji sustav obrade i prikupljanja rječničkog materijala. U malom, to je sustav za pronalaženje informacija koji je sposoban pružiti informacije o različitim aspektima teksta i vokabulara. Neki osnovni upiti prema ovom sustavu planirani su od samog početka: ukupan broj riječi inventara, statističke karakteristike pojedine riječi i cijelih rječnika, redoslijed čestih i rijetkih područja rječnika itd. Indeks strojnih kartica omogućuje vam da automatski izgraditi obrnute rječnike za pojedinačne žanrove i izvore. Mnoge druge korisne statističke informacije o jeziku bit će izvučene iz skupljenog niza informacija. Računalni frekvencijski rječnik stvara eksperimentalnu osnovu za prijelaz na opsežniju automatizaciju rječničkog rada.

Statistički podaci iz frekvencijskih rječnika mogu se široko koristiti u rješavanju drugih jezičnih problema - na primjer, u analizi i određivanju aktivnih sredstava za tvorbu riječi suvremenog ruskog jezika, rješavanju problema poboljšanja grafike i pravopisa, koji su povezani s uzimanjem u obzir statističkih informacije o sastavu vokabulara (uz sve to, važno je uzeti u obzir vjerojatnostna svojstva grafemskih kombinacija, vrste slovnih kombinacija implementiranih u riječi), praktičnu transkripciju i transliteraciju. Statistički parametri rječnika također će biti korisni u rješavanju problema automatizacije ispisa, prepoznavanja i automatskog čitanja abecednog teksta.

Suvremeni rječnici objašnjenja i gramatike ruskog jezika uglavnom su izgrađeni na temelju književnih i umjetničkih tekstova. Postoje frekvencijski rječnici jezika A.S. Puškina, A.S. Gribojedova, F.M. Dostojevski, V.V. Vysotsky i mnogi drugi autori. Na Odsjeku za povijest i teoriju književnosti Smolenskog državnog sveučilišta. Pedagoško sveučilište već niz godina radi na izradi frekvencijskih rječnika poetskih i proznih tekstova. Za ovu studiju odabrani su frekvencijski rječnici svih pjesama Puškina i još dva pjesnika zlatnog doba - “Jao od pameti” Gribojedova i cjelokupna poezija Ljermontova; Pasternak i pet drugih pjesnika Srebrnog doba - Balmont 1894-1903, Blokove "Pjesme o lijepoj dami", Mandeljštamov "Kamen", Gumiljovljev "Ognjeni stup", Ahmatova "Anno Domini MCMXXI" i "Sestra od Moj život” Pasternaka i još četiri pjesnika željeznog doba - “Pjesme Jurija Živaga”, “Kad se razvedri”, cijeli korpus lirike M. Petrovsa, “Daleka je cesta”, “Vjetrobran”, “ Zbogom snijegu” i “Potkovica” Mežirova, “Antimirov” Voznesenskog i “Snježna žena” » Rylenkova.

Valja napomenuti da su ovi rječnici različite naravi: jedni predstavljaju vokabular jednog dramskog djela, drugi - zbornik lirike, ili više knjiga, ili cijeli korpus poezije nekog pjesnika. Rezultate analize prikazane u ovom radu treba uzeti s oprezom, ne mogu se uzeti kao apsolutni. Istodobno, uz pomoć posebnih mjera, razlika u ontološkoj naravi tekstova može se donekle smanjiti.

Posljednjih godina sve se jasnije prepoznaje suprotnost između kolokvijalnog i knjižnog govora. O ovom se pitanju posebno žustro raspravlja među metodičarima koji traže zaokret u nastavi prema govornom jeziku. Istodobno, specifičnosti kolokvijalnog govora još uvijek ostaju nerazjašnjene.

Obrada rječnika provedena je izradom prilagođene aplikacije u uredskom programskom okruženju EXCEL97. Aplikacija uključuje četiri radna lista u EXCEL knjizi - “Title Sheet”, list “Dictionaries” s početnim podacima, “Proximities” i “Distances” s rezultatima, kao i skup makronaredbi.

Početni podaci upisuju se na listu “Rječnici”. Rječnici proučavanih tekstova upisuju se u ćelije EXCEL-a, zadnji stupac S formira se iz dobivenih rezultata i jednak je broju riječi koje se nalaze u drugim rječnicima. Tablice blizine i udaljenosti sadrže izračunate mjere blizine M, korelacije R i udaljenosti D.

Aplikacijske makronaredbe su procedure programiranja temeljene na događajima napisane u Visual Basicu za aplikacije (VBA). Procedure se temelje na objektima VBA biblioteke i metodama za njihovu obradu. Dakle, za rad s radnim listom aplikacije koristi se ključni objekt Worksheet i odgovarajuća metoda aktivacije lista Activate. Postavljanje raspona analiziranih izvornih podataka na listu "Rječnici" izvodi se metodom Select objekta Range, a prosljeđivanje riječi kao vrijednosti u varijable izvodi se kao svojstvo Value istog objekta Range.

Unatoč činjenici da nas analiza korelacije ranga čini opreznima u pogledu ovisnosti tema između različitih tekstova, većina najčešćih riječi u svakom tekstu ima podudaranja u jednom ili više drugih tekstova. U stupcu S prikazan je broj takvih riječi među 15 najčešćih riječi za svakog autora. Podebljanim slovima istaknute su riječi koje se u našoj tablici pojavljuju samo kod jednog pjesnika. Blok, Ahmatova i Petrov uopće nemaju istaknutih riječi, imaju S = 15. Za ova tri pjesnika svih 15 najčešćih riječi su iste, razlikuju se samo po mjestu na popisu. Ali čak i Puškin, čiji je vokabular najizvorniji, ima S = 8 i 7 istaknutih riječi.

Rezultati pokazuju da postoji određeni sloj vokabulara koji koncentrira glavne teme poezije. U pravilu su te riječi kratke: od ukupnog broja (225) upotrijebljenih riječi jednosložnih je 88, dvosložnih 127, a trosložnih 10. Često te riječi predstavljaju glavne mitologeme i mogu se podijeliti na parovi: noć - dan, zemlja - nebo (sunce), Bog - čovjek (ljudi), život - smrt, tijelo - duša, Rim - svijet(od Mandeljštama); mogu se kombinirati u mitologije više razine: nebo, zvijezda, sunce, zemlja; u osobi se u pravilu razlikuju tijelo, srce, krv, ruka, noga, obraz, oči. Među ljudskim stanjima prednost se daje snu i ljubavi. Kuća i gradovi pripadaju ljudskom svijetu - Moskva, Rim, Pariz. Kreativnost je predstavljena leksemima riječ I pjesma.

Gribojedov i Ljermontov među najčešćim riječima gotovo da nemaju riječi koje označavaju prirodu. Imaju tri puta više riječi koje označavaju osobu, dijelove njenog tijela, elemente njenog duhovnog svijeta. U Puškina i pjesnika XX. stoljeća. oznake čovjeka i prirode približno su jednako podijeljene. U ovom važnom aspektu teme možemo reći da je XX. stoljeće. slijedio Puškina.

Minimalna tema slučaj među najčešćim riječima nalazi se samo kod Gribojedova i Puškina. U Ljermontova i pjesnika XX. stoljeća. ustupa mjesto minimalnoj temi riječ. Riječ ne isključuje djelo (biblijsko tumačenje teme: u Novom zavjetu cjelokupno učenje Isusa Krista smatra se Božjom ili Isusovom riječju, a apostoli se ponekad nazivaju službenicima Riječi). Sveto značenje leksema riječi uvjerljivo se očituje, na primjer, u Pasternakovu stihu "I slika svijeta otkrivena u Riječi". Sveto značenje leksema riječ u su- i kontrastu s ljudskim poslovima uvjerljivo se očituje u istoimenoj pjesmi Gumiljova.

Leksemi koji se javljaju samo u jednom tekstu obilježavaju jedinstvenost pojedine knjige ili skupa knjiga. Na primjer, riječ "um" najčešća je u Gribojedovoj komediji "Jao od pameti" - ali je nema među najčešćim riječima u drugim tekstovima. Tema uma daleko je najznačajnija u komediji. Ovaj leksem prati sliku Chatskog, a ime Chatsky je najčešće u komediji. Dakle, rad organski spaja najčešću opću imenicu s najčešćom vlastitom imenicom.

Najveći koeficijent korelacije povezuje teme tragičnih knjiga Gumiljeva “Ognjeni stup” i Ahmatove “Anno Domini MCMXXI”. Među 15 najčešćih imenica ovdje, 10 ih je uobičajenih, uključujući krv, srce, dušu, ljubav, riječ, nebo. Podsjetimo, knjiga Akhmatove uključuje minijaturu "Nikada nećeš živjeti...", napisanu između uhićenja Gumiljova i njegova pogubljenja.

Teme svijeća i gužve u proučavanom materijalu nalaze se samo u "Pjesmama Jurija Živaga". Tema svijeće u pjesmama iz romana ima mnogo kontekstualnih značenja: povezuje se s likom Isusa Krista, s temama vjere, besmrtnosti, stvaralaštva, ljubavnog spoja. Svijeća je najvažniji izvor svjetla u središnjim prizorima romana. Tema gomile razvija se u vezi s glavnom idejom romana, u kojoj se privatni život osobe sa svojim nepokolebljivim vrijednostima suprotstavlja nemoralu nove države, izgrađene na principima ugađanja gomili. .

Rad uključuje treću fazu, koja se također odražava u programu, - to je izračun razlike u rednim brojevima riječi zajedničkih za dva rječnika i prosječne udaljenosti između identičnih riječi dvaju rječnika. Ova nam faza omogućuje prijelaz s općih trendova u interakciji rječnika, utvrđenih pomoću statistike, na razinu koja se približava tekstu. Na primjer, knjige Gumiljova i Ahmatove su statistički značajno povezane. Gledamo koje su riječi zajedničke njihovim rječnicima, a prije svega odabiremo one čija je razlika između rednih brojeva minimalna ili jednaka nuli. Upravo te riječi imaju isti broj ranga i stoga su te minimalne teme jednako važne u svijesti dvojice pjesnika. Zatim biste trebali prijeći na razinu tekstova i konteksta.

Kvantitativne metode također pomažu u proučavanju karakteristika izvornih govornika. Recimo, u ruskom jeziku ima 6 padeža, u engleskom nema padeža, au nekim jezicima naroda Dagestana broj padeža doseže 40. L. Perlovsky u svom članku “Svijest, jezik i kultura” povezuje te karakteristike sa sklonošću naroda individualizmu ili kolektivizmu, sa shvaćanjem stvari i pojava zasebno ili u vezi s drugima. Uostalom, upravo su se u engleskom govornom području (nema slučajeva - stvar se percipira "sama po sebi") pojavili pojmovi kao što su osobna sloboda, liberalizam i demokracija (napominjemo da te pojmove koristim samo u vezi s jezikom, bez ikakvih evaluacijskih karakteristika). Unatoč činjenici da takve pretpostavke još uvijek ostaju samo na razini hrabrih znanstvenih hipoteza, one pomažu da se poznate pojave pogledaju na novi način.

Kao što vidimo, kvantitativne karakteristike mogu se koristiti u potpuno različitim područjima lingvistike, što sve više briše granice između “egzaktnih” i “humanitarnih” metoda. Lingvistika u rješavanju svojih problema sve više pribjegava pomoći ne samo matematike, već i računalne tehnologije.

2.3 Proučavanje Ijezik koristeći metode formalne logike

Suvremena teorijska lingvistika komunicira s nekvantitativnim metodama matematike, posebice s logikom, ne manje plodonosno nego s kvantitativnim. Nagli razvoj računalnih tehnologija i povećanje njihove uloge u moderni svijet zahtijevala reviziju pristupa interakciji jezika i logike u cjelini.

Metode logike naširoko se koriste u razvoju formaliziranih jezika, posebice programskih jezika, čiji su elementi određeni simboli (slični matematičkim), odabrani (ili konstruirani od prethodno odabranih simbola) i interpretirani na određeni način, povezani s nema “tradicionalne” uporabe, razumijevanja i funkcija istih simbola u drugim kontekstima. Programer se u svom radu stalno bavi logikom. Smisao programiranja je upravo naučiti računalo rasuđivanju (u širem smislu riječi). U isto vrijeme, pokazalo se da su metode "rezoniranja" vrlo različite. Svaki programer provede određeno vrijeme tražeći greške u svojim i tuđim programima. Odnosno, tražiti pogreške u zaključivanju, u logici. I ovo također ostavlja traga. Puno je lakše otkriti logičke pogreške u običnom govoru. Relativna jednostavnost jezika koje proučavaju logičari omogućuje im da jasnije razjasne strukture tih jezika nego što je to moguće postići lingvistima koji analiziraju isključivo složene prirodne jezike. Budući da jezici koje proučavaju logičari koriste relacije kopirane iz prirodnih jezika, logičari mogu dati značajan doprinos općoj teoriji jezika. Ovdje je situacija slična onoj koja se događa u fizici: fizičar također formulira teoreme za idealno pojednostavljene slučajeve koji se uopće ne pojavljuju u prirodi - on formulira zakone za idealne plinove, idealne tekućine, govori o gibanju bez trenja itd. . Za te idealizirane slučajeve mogu se ustanoviti jednostavni zakoni koji bi uvelike pridonijeli razumijevanju onoga što se događa u stvarnosti i što bi fizici vjerojatno ostalo nepoznanica kada bi pokušala promatrati stvarnost izravno, u svoj njezinoj složenosti.

U proučavanju prirodnih jezika koriste se logičke metode kako oni koji uče jezik ne bi mogli glupo "zapamtiti" što više riječi, već bolje razumjeti njegovu strukturu. L. Shcherba je također u svojim predavanjima koristio primjer rečenice sastavljene prema zakonima ruskog jezika: “Glokaya kuzdra shteko budlanul bokra i kurdyachit bokrenka”, a zatim je pitao studente što to znači. Unatoč činjenici da je značenje riječi u rečenici ostalo nejasno (jednostavno ne postoje u ruskom jeziku), bilo je moguće jasno odgovoriti: "kuzdra" - subjekt, imenica žena, u jednini, nominativu, “bokr” - oživiti itd. Prijevod fraze je otprilike ovakav: “Nešto ženstveno u jednom je koraku učinilo nešto nekom stvorenju muški, a onda je počeo nešto dugo i postupno raditi sa svojim mladunčetom.” Sličan primjer teksta (fikcije) od nepostojećih riječi, sazdanog u potpunosti prema zakonima jezika, je “Jabberwocky” Lewisa Carrolla (u “Alisi u zemlji čudesa” Carroll kroz usta svog lika Humpty Dumptyja objašnjava značenje riječi koje je izmislio: "kuhano" - osam sati navečer, kada je vrijeme za kuhanje večere, "khliky" - krhak i spretan, "shoryok" - križanac između tvora, jazavca i vadičepa, "kopati" - skakati, roniti, vrtjeti se, "nava" - trava ispod sunčanog sata (proteže se malo udesno, malo ulijevo i malo natrag), "gunđati" - gunđati i smijati se, "zelyuk" - a zelena ćurka, "mjumzik" - ptica; perje joj je raščupano i strši na sve strane, poput metle, "mova" - daleko od kuće) .

Jedan od temeljnih pojmova moderne logike i teorijske lingvistike, koji se koristi u proučavanju jezika različitih logičko-matematičkih računa, prirodnih jezika, za opisivanje odnosa između jezika različitih "razina" i za karakterizaciju odnosa između jezika o kojima je riječ i uz njihovu pomoć opisanih tematskih područja je pojam metajezika. Metajezik je jezik koji se koristi za izražavanje sudova o drugom jeziku, objektnom jeziku. Uz pomoć metajezika proučavaju strukturu znakovnih kombinacija (izražaja) predmetnog jezika, dokazuju teoreme o njegovim izražajnim svojstvima, odnosu s drugim jezicima itd. Jezik koji se proučava naziva se i objektivni jezik u odnosu na ovaj metajezik. I predmetni jezik i metajezik mogu biti obični (prirodni) jezici. Metajezik se može razlikovati od predmetnog jezika (na primjer, u engleskom udžbeniku za Ruse, ruski je metajezik, a engleski je objektni jezik), ali se može podudarati s njim ili se samo djelomično razlikovati, na primjer, u posebnoj terminologiji ( Ruska lingvistička terminologija je element metajezika za opisivanje ruskog jezika; takozvani semantički čimbenici dio su metajezika za opisivanje semantike prirodnih jezika).

Koncept "metajezika" postao je vrlo plodan u vezi s proučavanjem formaliziranih jezika konstruiranih u okviru matematičke logike. Za razliku od formaliziranih predmetnih jezika, u ovom je slučaju metajezik, pomoću kojeg se formulira metateorija (proučavajući svojstva predmetne teorije formulirane u predmetnom jeziku), u pravilu obični prirodni jezik, neki posebno ograničeni fragment prirodni jezik koji ne sadrži nikakvu dvosmislenost, metafore, "metafizičke" koncepte itd. elemente običnog jezika koji onemogućuju njegovu upotrebu kao alata za točno znanstveno istraživanje. U tom se slučaju sam metajezik može formalizirati i (bez obzira na to) postati predmetom istraživanja koja se provode pomoću metametajezika, a takav se niz može “misliti” neograničeno rasti.

Logika nas uči plodnoj razlici između predmetnog jezika i metajezika. Jezik-objekt sam je predmet logičkog istraživanja, a metajezik je neizbježno umjetni jezik na kojem se takva istraživanja provode. Logičko mišljenje sastoji se upravo u formuliranju u jeziku simbola (metajezik) odnosa i strukture stvarnog jezika (jezik-objekt).

Metajezik u svakom slučaju ne smije biti “ne siromašniji” od svog predmetnog jezika (tj. za svaki izraz potonjeg u metajeziku mora postojati njegovo ime - “prijevod”) - inače, ako ti zahtjevi nisu ispunjeni (što se očito događa, u prirodnim jezicima, ako posebnim ugovorima nije drugačije određeno), nastaju semantički paradoksi (antinomije).

Kako se stvara sve više i više novih programskih jezika, u vezi s problemom programiranja prevoditelja, pojavila se hitna potreba za stvaranjem metajezika. Trenutno se za opisivanje sintakse programskih jezika najčešće koristi metajezik oblika Backus-Naur (skraćeno BNF). Predstavljen je u kompaktnom obliku u obliku nekih formula sličnih matematičkim. Za svaki pojam jezika postoji jedna metaforska formula (normalna formula). Sastoji se od lijevog i desnog dijela. Lijeva strana označava koncept koji se definira, a desna strana specificira skup prihvatljivih jezičnih konstrukcija koje se kombiniraju u ovaj koncept. U formuli se koriste posebni metasimboli u obliku uglastih zagrada koji sadrže definirani pojam (na lijevoj strani formule) ili prethodno definirani pojam (na desnoj strani), a razdvajanje lijevog i desnog dijela označeno je s metasimbol "::=", čije je značenje ekvivalentno riječima "po definiciji postoji." Metalingvističke formule su u nekom obliku ugrađene u prevoditelje; uz njihovu pomoć se provjerava formalna usklađenost konstrukcija koje koristi programer s bilo kojom od konstrukcija koje su sintaktički prihvatljive u ovom jeziku. Postoje i zasebni metajezici raznih znanosti - dakle, znanje postoji u obliku raznih metajezika.

Logičke metode poslužile su i kao osnova za stvaranje sustava umjetne inteligencije temeljenih na konceptu konekcionizma. Konekcionizam je poseban pokret u filozofskoj znanosti, čiji su predmet pitanja znanja. U sklopu tog pokreta pokušavaju se objasniti ljudske intelektualne sposobnosti pomoću umjetnih neuronskih mreža. Sastavljene od velikog broja strukturnih jedinica, sličnih neuronima, s težinom dodijeljenom svakom elementu koja određuje snagu veza s drugim elementima, neuronske mreže su pojednostavljeni modeli ljudskog mozga. Eksperimenti s ovim vrstama neuronskih mreža pokazali su njihovu sposobnost učenja zadataka kao što su prepoznavanje uzoraka, čitanje i identificiranje jednostavnih gramatičkih struktura.

Filozofi su se počeli zanimati za konekcionizam jer je konekcionistički pristup obećavao da će pružiti alternativu klasičnoj teoriji uma i široko rasprostranjenoj ideji unutar te teorije da rad uma nalikuje obradi simboličkog jezika digitalnim računalom. Ovaj koncept je vrlo kontroverzan, ali posljednjih godina nalazi sve više pristalica.

Logičko proučavanje jezika nastavlja Saussureov koncept jezika kao sustava. Činjenica da se neprestano nastavlja još jednom potvrđuje smjelost znanstvenih nagađanja s početka prošlog stoljeća. Posljednji dio svog rada posvetit ću izgledima za razvoj matematičkih metoda u lingvistici danas.

2.4 Perspektive primjene matematičkih metoda u lingvistici

U eri računalne tehnologije metode matematičke lingvistike dobile su novu razvojnu perspektivu. Potraga za rješenjima problema lingvističke analize danas se sve više provodi na razini informacijskih sustava. Istodobno, automatizacija procesa obrade jezične građe, pružajući istraživaču značajne mogućnosti i prednosti, neminovno pred njega postavlja nove zahtjeve i zadatke.

Kombinacija “egzaktnog” i “humanitarnog” znanja postala je plodno tlo za nova otkrića u poljima lingvistike, informatike i filozofije.

Strojno prevođenje s jednog jezika na drugi ostaje brzorastuća grana informacijske tehnologije. Unatoč činjenici da prijevod pomoću računala nikada neće biti usporediv u kvaliteti s prijevodom koji je izradila osoba (osobito za književne tekstove), stroj je postao integralni ljudski pomoćnik u prevođenju velikih količina teksta. Vjeruje se da će se u bliskoj budućnosti stvoriti napredniji sustavi prevođenja koji će se prvenstveno temeljiti na semantičkoj analizi teksta.

Jednako obećavajući smjer ostaje interakcija lingvistike i logike, koja služi kao filozofski temelj za razumijevanje informacijske tehnologije i tzv. "virtualne stvarnosti". U bliskoj budućnosti nastavit će se raditi na stvaranju sustava umjetne inteligencije – iako, opet, ona po svojim sposobnostima nikada neće biti jednaka ljudskoj inteligenciji. Takvo natjecanje je besmisleno: u naše vrijeme stroj bi trebao postati (i postaje) ne suparnik, već ljudski pomoćnik, ne nešto iz domene fantazije, već dio stvarnog svijeta.

Proučavanje jezika nastavlja se korištenjem statističkih metoda, što nam omogućuje točnije određivanje njegovih kvalitativnih svojstava. Važno je da najsmjelije hipoteze o jeziku nađu svoj matematički, a time i logički dokaz.

Najznačajnije je to što su različite grane primjene matematike u lingvistici, prethodno prilično različite, posljednjih godina povezane jedna s drugom, sjedinjujući se u koherentan sustav, po analogiji sa sustavom jezika koji je prije jednog stoljeća otkrio Ferdinand de Saussure i Yvan Baudouin de Courtenay. To je kontinuitet znanstvenih spoznaja.

Lingvistika je u suvremenom svijetu postala temelj razvoja informacijske tehnologije. Sve dok je računalna znanost grana ljudske djelatnosti koja se brzo razvija, spoj matematike i lingvistike i dalje će igrati svoju ulogu u razvoju znanosti.

Zaključak

Tijekom dvadesetog stoljeća računalna je tehnologija prešla dug put - od vojne do miroljubive uporabe, od uskog spektra namjena do prodora u sve sektore ljudskog života. Matematika je kao znanost razvojem računalne tehnologije dobila novo praktično značenje. Ovaj proces traje i danas.

Dotad nezamisliv “tandem” “fizičara” i “liričara” postao je stvarnost. Za potpunu interakciju matematike i informatike s humanističkim znanostima bili su potrebni kvalificirani stručnjaci s obje strane. Dok računalni stručnjaci sve više trebaju sustavna humanitarna znanja (jezična, kulturološka, ​​filozofska) kako bi shvatili promjene u stvarnosti oko sebe, u interakciji čovjeka i tehnologije, razvili sve više novih jezičnih i mentalnih koncepata, pisali programe, bilo koji "humanitarac" u naše vrijeme za svoje profesionalni rast mora ovladati barem osnovama rada s računalom.

Matematika, koja je usko povezana s informatikom, nastavlja se razvijati i komunicirati s prirodnim i humanističkim znanjima. U novom stoljeću tendencija matematizacije znanosti ne slabi, nego se, naprotiv, pojačava. Pomoću kvantitativnih podataka sagledavaju se zakonitosti razvoja jezika, njegove povijesne i filozofske karakteristike.

Matematički formalizam je najprikladniji za opisivanje obrazaca u lingvistici (kao, uostalom, iu drugim znanostima - kako humanističkim tako i prirodnim znanostima). Situacija se ponekad u znanosti razvija na takav način da je bez korištenja odgovarajućeg matematičkog jezika nemoguće razumjeti prirodu fizikalnih, kemijskih itd. proces je nemoguć. Stvaranje planetarnog modela atoma, slavni engleski fizičar 20.st. E. Rutherford je imao matematičkih poteškoća. Isprva njegova teorija nije bila prihvaćena: nije zvučala uvjerljivo, a razlog tome bilo je Rutherfordovo nepoznavanje teorije vjerojatnosti, na temelju čijeg je mehanizma jedino bilo moguće razumjeti modelski prikaz međudjelovanja atoma. Shvativši to, već izvanredni znanstvenik u to vrijeme, vlasnik Nobelova nagrada, upisao je seminar matematičara profesora Lamba te dvije godine zajedno sa studentima slušao tečaj i radio radionicu iz teorije vjerojatnosti. Na temelju toga Rutherford je uspio opisati ponašanje elektrona, dajući svom strukturnom modelu uvjerljivu točnost i stekavši priznanje. Isto je i s lingvistikom.

Ovo postavlja pitanje, što je toliko matematičko sadržano u objektivnim pojavama da ih čini podložnima opisivanju jezikom matematike, jezikom kvantitativnih karakteristika? To su homogene jedinice materije raspoređene u prostoru i vremenu. One znanosti koje su otišle dalje od drugih prema identifikaciji homogenosti pokazale su se prikladnijima za korištenje matematike u njima.

Internet, koji se naglo razvio 90-ih godina, ujedinio je predstavnike raznih zemalja, naroda i kultura. Unatoč činjenici da je engleski i dalje glavni jezik međunarodne komunikacije, internet je u naše vrijeme postao višejezičan. To je dovelo do razvoja komercijalno uspješnih sustava za strojno prevođenje, široko korištenih u raznim područjima ljudske djelatnosti.

Računalne mreže postale su predmetom filozofskog razumijevanja - stvara se sve više novih lingvističkih, logičkih, svjetonazorskih koncepata koji pomažu razumijevanju "virtualne stvarnosti". U mnogim umjetničkim djelima stvoreni su scenariji – često pesimistični – o dominaciji strojeva nad ljudima, te o dominaciji virtualne stvarnosti nad okolnim svijetom. Nisu se uvijek takve prognoze pokazale besmislenim. Informacijska tehnologija nije samo obećavajuće područje za ulaganje ljudskog znanja, ona je i način kontrole informacija, a time i ljudske misli.

Ova pojava ima i negativnu i pozitivnu stranu. Negativno – jer je kontrola nad informacijama u suprotnosti s neotuđivim ljudskim pravom na slobodan pristup istima. Pozitivno – jer nedostatak te kontrole može dovesti do katastrofalnih posljedica za čovječanstvo. Dovoljno je prisjetiti se jednog od najmudrijih filmova prošlog desetljeća - "Kad smak svijeta" Wima Wendersa, čiji su likovi potpuno uronjeni u "virtualnu stvarnost" vlastitih snova, snimljenih na računalu. Istodobno, niti jedan znanstvenik ili umjetnik ne može dati jasan odgovor na pitanje: što znanost i tehnologiju čeka u budućnosti.

Usredotočenost na "budućnost", koja se ponekad čini fantastičnom, bila je prepoznatljiva značajka znanosti sredinom dvadesetog stoljeća, kada su izumitelji nastojali stvoriti savršene primjere tehnologije koja bi mogla funkcionirati bez ljudske intervencije. Vrijeme je pokazalo utopističnost takvih istraživanja. Pritom bi bilo nepotrebno osuđivati ​​znanstvenike zbog toga - bez njihovog entuzijazma u 1950-im i 60-im godinama, informacijska tehnologija ne bi napravila tako snažan skok u 90-ima, a mi ne bismo imali ovo što imamo sada.

Posljednja desetljeća dvadesetog stoljeća promijenila su prioritete znanosti - istraživanja, inventivni patos ustupio je mjesto komercijalnom interesu. Opet, ovo nije ni dobro ni loše. Ovo je stvarnost u kojoj je znanost sve više integrirana u svakodnevni život.

Dolazak 21. stoljeća nastavio je taj trend, au naše vrijeme iza izuma ne stoje samo slava i priznanje, već prije svega novac. Zbog toga je također važno osigurati da najnovija dostignuća znanosti i tehnologije ne padnu u ruke terorističkih skupina ili diktatorskih režima. Zadatak je težak do nemogućnosti; Ostvariti ga u što većoj mjeri zadatak je cijele svjetske zajednice.

Informacija je oružje, i to oružje ništa manje opasno od nuklearnog ili kemijskog - samo što ne djeluje fizički, nego psihološki. Čovječanstvo treba razmisliti što mu je u ovom slučaju važnije - sloboda ili kontrola.

Najnoviji filozofski koncepti povezani s razvojem informacijskih tehnologija i pokušaji njihova razumijevanja pokazali su ograničenost kako prirodnoznanstvenog materijalizma, koji je dominirao kroz 19. i početkom 20. stoljeća, tako i ekstremnog idealizma, koji negira značaj materijalnog svijeta. Za suvremenu misao, posebice zapadnu, važno je prevladati taj dualizam u mišljenju, kada je svijet oko nas jasno podijeljen na materijalno i idealno. Put do toga je dijalog kultura, usporedba različitih gledišta na okolne pojave.

Paradoksalno, informacijska tehnologija može igrati važnu ulogu u ovom procesu. Računalne mreže, a posebice internet, nisu samo izvor zabave i živahne komercijalne aktivnosti, one su i sredstvo sadržajne, kontroverzne komunikacije između predstavnika različitih civilizacija u suvremenom svijetu, kao i za dijalog između prošlosti i predstaviti. Možemo reći da internet proširuje prostorne i vremenske granice.

A u dijalogu kultura putem informacijske tehnologije i dalje je važna uloga jezika kao najstarijeg univerzalnog sredstva komunikacije. Zato je lingvistika u interakciji s matematikom, filozofijom i informatikom doživjela svoj preporod i nastavlja se razvijati do danas. Trend sadašnjosti nastavit će se iu budućnosti - "do kraja svijeta", kako je isti V. Wenders predvidio prije 15 godina. Istina, ne zna se kada će se taj kraj dogoditi – ali je li to sada važno, jer prije ili kasnije budućnost će ipak postati sadašnjost.

Prilog 1

Ferdinand de Saussure

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) naširoko se smatra utemeljiteljem moderne lingvistike u svojim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i jezičnih oblika. Zapravo, metoda strukturalizma u lingvistici i literarnoj znanosti i značajna grana semiotike nalaze svoje glavno polazište u njegovom radu na prijelazu u dvadeseto stoljeće. Čak se tvrdilo da je kompleks strategija i koncepcija koji je nazvan "poststrukturalizam" - rad Jacquesa Derridae, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih - sugeriran Saussureovim radom u lingvistici i anagramska čitanja kasne latinske poezije. Ako je to tako, može se najjasnije vidjeti na način na koji Saussureov rad u lingvistici i tumačenju sudjeluje u transformacijama u načinima razumijevanja u širokom rasponu intelektualnih disciplina od fizike do književnog modernizma psihoanalizi i filozofiji u ranom dvadesetom stoljeću. Kao što Algirdas Julien Greimas i Joseph Courtes tvrde u Semiotici i jeziku: Analitički rječnik, pod naslovom "Tumačenje", novi način tumačenja pojavio se početkom dvadesetog stoljeća koji oni poistovjećuju sa Saussureovom lingvistikom, Husserlijevom fenomenologijom i Freudovskom psihoanalizom. U ovom načinu, "interpretacija više nije stvar pripisivanja određenog sadržaja obliku koji bi inače nedostajao; prije je to parafraza koja na drugi način formulira ekvivalentni sadržaj označiteljskog elementa unutar danog semiotičkog sustava" ( 159). U ovom razumijevanju "tumačenja", forma i sadržaj nisu različiti; nego je svaki "forma", alternativno, i semantički "sadržaj", "označni oblik", tako da interpretacija nudi analognu parafrazu nečega što već označava unutar nekog drugog sustava označavanja.

Takva reinterpretacija forme i razumijevanja - koju Claude Levi-Strauss opisuje u jednoj od svojih najprogramskijih artikulacija koncepta strukturalizma, u "Struktura i forma: Razmišljanja o djelu Vladimira Proppa" - implicitna je u Saussureovom posthumnom Tečaju u općoj lingvistici (1916., prijevod, 1959., 1983.). Tijekom svog života, Saussure je objavljivao relativno malo, a njegovo glavno djelo, Tečaj, bio je prijepis nekoliko kolegija iz opće lingvistike koje je držao 1907.-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika za razliku od rada u povijesnoj lingvistici koji je obavljen u devetnaestom stoljeću. Taj je rad jedno od velikih postignuća zapadnog intelekta: uzimanje određenih riječi kao građevnih blokova jezika, povijesna (ili "dijakronijska") lingvistika pratila je podrijetlo i razvoj zapadnih jezika iz pretpostavljenog izvora zajedničkog jezika, prvo "indoeuropskog" jezika, a potom ranijeg "protoindoeuropskog" jezika.

Saussure je doveo u pitanje upravo to proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mase činjenica o jeziku, koje je povijesna lingvistika tako detaljno proučavala, na podnošljiv broj prijedloga. "Komparativna škola" filologije devetnaestog stoljeća, kaže Saussure u Tečaju, "nije uspjela uspostaviti pravu znanost lingvistike" jer "nije uspjela pronaći prirodu svog predmeta proučavanja" (3). Ta se "priroda", tvrdi on, ne nalazi samo u "elementarnim" riječima koje jezik sadrži - naizgled "pozitivnim" činjenicama (ili "supstancama") jezika - već u formalnim odnosima koji dovode do tih "tvari".

Saussureovo sustavno preispitivanje jezika temelji se na tri pretpostavke. Prva je da znanstveno proučavanje jezika treba razvijati i proučavati sustav, a ne povijest jezičnih pojava. Iz tog razloga on razlikuje posebne pojave jezika - njegove posebne "govorni događaji", koje on dizajnira kao parole - i pravi objekt lingvistike, sustav (ili "kod") koji upravlja tim događajima, a koje on dizajnira kao langue. Takva sustavna studija, štoviše, poziva na "sinkronijsko" koncepcija odnosa među elementima jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz povijest.

Ova pretpostavka dovela je do onoga što je Roman Jakobson 1929. godine označio kao "strukturalizam", u kojem se "bilo koji skup fenomena koji ispituje suvremena znanost ne tretira kao mehanička aglomeracija, već kao strukturna cjelina, mehanička koncepcija procesa podliježe pitanju njihove funkcije" ("Romantika" 711). U ovom odlomku Jakobson artikulira Saussureovu namjeru da definira lingvistiku kao znanstveni sustav nasuprot jednostavnom, "mehaničkom" obračunu povijesnih nesreća. Uz to, štoviše, Jakobson je također druga temeljna pretpostavka u Saussureanu - sada možemo nazvati "strukturnim" - lingvistikom: da se osnovni elementi jezika mogu proučavati samo u odnosu na njihove funkcije, a ne u odnosu na njihove uzroke. Umjesto proučavanja posebnih i jedinstvenih događaja i entiteta (tj. povijesti pojedinih indoeuropskih "riječi"), ti događaji i entiteti moraju biti smješteni unutar sustavnog okvira u kojem su povezani s drugim takozvanim događajima i entitetima. To je radikalna preorijentacija u poimanju iskustva i fenomena, čiju je važnost filozof Ernst Cassirer usporedio s "novom Galileijevom znanošću koja je u sedamnaestom stoljeću promijenila cijeli naš koncept fizičkog svijeta" (citirano u Culler, Pursuit 24). Ova promjena, kao što primjećuju Greimas i Courtes, ponovno shvaća "interpretaciju" i tako ponovno shvaća objašnjenje i razumijevanje samih sebe. Umjesto da objašnjenje bude u terminima uzroka fenomena, tako da je, kao "posljedica", na neki način podređeno svojim uzrocima, objašnjenje se ovdje sastoji u podređivanju fenomena njegovoj "funkciji" usmjerenoj na budućnost ili "Svrha." Objašnjenje više nije neovisno o ljudskim namjerama ili svrhama (iako te namjere mogu biti neosobne, zajedničke ili, u Freudovim terminima, "nesvjesne").

U svojoj lingvistici Saussure ostvaruje ovu transformaciju posebno u redefiniranju jezične "riječi", koju opisuje kao jezični "znak" i definira funkcionalističkim terminima. Znak je, tvrdi on, spoj "koncepta i zvučne slike", koju je nazvao "označeno i označitelj" (66-67; prijevod Roya Harrisa iz 1983. nudi izraze "označenje" i "signal"). njihove "kombinacije" je "funkcionalna" utoliko što ni označeno ni označitelj nisu "uzrok" drugoga; radije, "svako svoje vrijednosti iz drugoga" (8). Na taj način Saussure definira osnovnu element jezika, znak, relacijski i čini osnovnu pretpostavku povijesne lingvistike, naime, identitet elementarnih jedinica jezika i označavanja (tj. "riječi"), predmetom rigorozne analize. Razlog zašto možemo prepoznati različite pojave riječ "stablo" kao "ista" riječ nije zato što je riječ definirana inherentnim kvalitetama - to nije "mehanička nakupina" takvih kvaliteta - već zato što je definirana kao element u sustavu, "strukturalna cjelina " " jezika.

Takva relacijska (ili "dijakritička") definicija entiteta upravlja koncepcijom svih elemenata jezika u strukturalnoj lingvistici. To je najjasnije u najdojmljivijem postignuću saussureovske lingvistike, razvoju pojmova "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje artikulirane i označiteljske jedinice jezika. To nisu zvukovi koji se pojavljuju u jeziku, već "zvučne slike" koje spominje Saussure, a koje govornici shvaćaju - fenomenalno shvaćaju - kao prenošenje značenja. (Dakle, Elmar Holenstein opisuje Jakobsonovu lingvistiku, koja na važne načine slijedi Saussurea, kao "fenomenološki strukturalizam".) Iz tog je razloga vodeći glasnogovornik strukturalizma Praške škole, Jan Mukarovsky, primijetio 1937. da je "struktura. . . je fenomenološka a ne empirijska stvarnost; nije djelo samo po sebi, već skup funkcionalnih odnosa koji se nalaze u svijesti kolektiva (generacije, sredine, itd.)" (citirano u Galan 35). Slično, Levi-Strauss, vodeći glasnogovornik francuskog strukturalizma , primijetio je 1960. da "struktura nema poseban sadržaj; on je sam sadržaj, a logična organizacija u kojoj je uhićen zamišljena je kao svojstvo stvarnog" (167; vidi također Jakobson, Fundamentals 27-28).

Fonemi, dakle, najmanji perceptibilni elementi jezika, nisu pozitivni objekti nego "fenomenološka stvarnost". U engleskom jeziku, na primjer, fonem /t/ može se izgovoriti na mnogo različitih načina, ali u svim će slučajevima govornik engleskog prepoznati da funkcionira kao /t/. Aspirirano t (tj. t koje se izgovara s dahom nalik na h nakon njega), visoki ili niski t, produženi t i tako dalje, svi će funkcionirati na isti način u razlikovanju značenja "to" i "do" na engleskom. Štoviše, razlike među jezicima su takve da fonološke varijacije u jednom jeziku mogu činiti različite foneme u drugom; Dakle, engleski razlikuje /l/ i /r/, dok su drugi jezici tako strukturirani da se te artikulacije smatraju varijacijama istog fonema (poput aspiriranog i neaspiriranog t u engleskom). U svakom prirodnom jeziku, veliki broj mogućih riječi je kombinacija malog broja fonema. Engleski, na primjer, posjeduje manje od 40 fonema koji se kombiniraju u više od milijun različitih riječi.

Fonemi jezika sami su sustavno organizirane strukture obilježja. U 1920-im i 1930-im godinama, slijedeći Saussureovo vodstvo, Jakobson i N. S. Trubetzkoy izolirali su "različite značajke" fonema. Te značajke temelje se na fiziološkoj strukturi govornih organa - jezika, zuba, glasnica i tako dalje - da Saussure spominje u Tečaju i koje Harris opisuje kao "fiziološku fonetiku" ( 39; Baskinov raniji prijevod koristi pojam "fonologija" [(1959) 38]) - i oni se kombiniraju u "snopove" binarnih opozicija kako bi formirali foneme. Na primjer, u engleskom jeziku razlika između /t/ i /d/ je prisutnost ili odsutnost “glasa” (angažiranja glasnica), a na razini glasanja ti se fonemi uzajamno definiraju. Na taj je način fonologija specifičan primjer općeg pravila jezika koje je opisao Saussure: U jeziku postoje samo razlike. Još važnije: razlika općenito podrazumijeva pozitivne pojmove između kojih se razlika postavlja; ali u jeziku postoje samo razlike bez pozitivnih pojmova. Bilo da uzmemo označeno ili označitelj, jezik nema niti ideje niti zvukove koji su postojali prije lingvističkog sustava. (120)

U tom okviru, jezični identiteti nisu određeni inherentnim kvalitetama, već sustavnim ("strukturalnim") odnosima.

Rekao sam da je fonologija "sljedila vodstvo" Saussurea, jer iako bi se njegova analiza fiziologije jezične produkcije "danas", kako kaže Harris, "nazvala "fizičkom", za razliku od "psihološke" ili "funkcionalne", "" (Lektira 49), ipak je u Tečaju artikulirao smjer i obrise funkcionalne analize jezika. Slično tome, njegovo jedino prošireno objavljeno djelo, Memoire sur le systeme primitif des voyelles dans les langues Indo-Europeennes (Memoari o primitivnom sustavu samoglasnika u indoeuropskim jezicima), koje se pojavilo 1878., bilo je u potpunosti smješteno unutar projekta devetnaestog- stoljeća povijesna lingvistika. Unatoč tome, unutar ovog rada, kao što je raspravljao Jonathan Culler, Saussure je pokazao "plodnost razmišljanja o jeziku kao sustavu čisto relacijskih stavki, čak i kada radi na zadatku povijesne rekonstrukcije" (Saussure 66). Analizirajući sustavne strukturne odnose među fonemima kako bi se objasnili obrasci izmjene samoglasnika u postojećim indoeuropskim jezicima, Saussure je sugerirao da je uz nekoliko različitih fonema /a/ morao postojati još jedan fonem koji se može formalno opisati. "Ono što Saussureov rad čini tako vrlo dojmljivim," zaključuje Culler, "je činjenica da je gotovo pedeset godina kasnije, kada je klinasti hetitski jezik otkriven i dešifriran, pronađeno da sadrži fonem, napisan h, koji se ponašao kako je Saussure predvidio . On je čisto formalnom analizom otkrio ono što je danas poznato kao laringeali Indo-Europljana" (66).

Ova koncepcija relacijske ili dijakritičke determinacije elemenata označavanja, koja je i implicitna i eksplicitna u Tečaju, sugerira treću pretpostavku koja upravlja strukturnom lingvistikom, što Saussure naziva "proizvoljnom prirodom znaka". Time želi reći da odnos između označitelja i označenog u jeziku nikada nije nužan (ili "motiviran"): moglo bi se jednako lako pronaći zvučni označitelj arbre kao i stablo označitelja da se ujedine s pojmom "stablo". Ali više od ovoga, to znači da je znak također proizvoljan: moglo bi se lako definirati pojam "stablo" njegovom drvenastom kvalitetom (što bi isključilo palme) kao i njegovom veličinom (što isključuje "nisko drvenaste biljke" zvati grmlje). Ovo bi trebalo razjasniti da numeriranje pretpostavki koje sam predstavio ne predstavlja redoslijed prioriteta: svaka pretpostavka - sustavna priroda označavanja (koju je najbolje shvatiti proučavanjem jezika "sinkronijski"), relacijska ili "dijakritička" priroda elemenata značenja, proizvoljna priroda znakova - crpi svoju vrijednost iz drugih.

To jest, saussureovska lingvistika shvaća fenomene koje proučava u sveobuhvatnim odnosima kombinacije i kontrasta u jeziku. U ovoj koncepciji jezik je i proces artikuliranja značenja (označavanje) i njegov proizvod (komunikacija), a te dvije funkcije jezika nisu niti identične niti potpuno podudarne (vidi Schleifer, “Deconstruction”). Ovdje možemo vidjeti izmjenu forme i sadržaja koju Greimas i Courtes opisuju u modernističkoj interpretaciji: jezik predstavlja kontraste koji formalno definiraju njegove jedinice, a te se jedinice kombiniraju na sljedećim razinama kako bi stvorile sadržaj označavanja. Budući da su elementi jezika proizvoljni, štoviše, ni kontrast ni kombinacija ne mogu se reći da su osnovni. , u jezičnim razlikovnim značajkama kombiniraju se da tvore kontrastne foneme na drugoj razini razumijevanja, fonemi se kombiniraju da tvore Tako kontrastne morfeme, morfemi se kombiniraju da tvore riječi, riječi se kombiniraju da tvore rečenice, i tako dalje. U svakom slučaju, cijeli fonem, ili riječ, ili rečenica, i tako dalje, veći je od zbroja svojih dijelova (baš kao što je voda, H2O, u Saussureovom primjeru [(1959) 103] više od mehaničke aglomeracije vodika i kisika).

Tri pretpostavke Tečaja opće lingvistike navele su Saussurea da pozove na novu znanost dvadesetog stoljeća koja bi nadišla lingvističku znanost kako bi proučavala "život znakova unutar društva". Saussure je ovu znanost nazvao "semiologija (od grčkog semeion "znak")" (16). "Znanost" semiotike, kako se počela prakticirati u istočnoj Europi 1920-ih i 1930-ih i Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književne artefakte sastavljene (ili artikulirane) tim strukturama. Tijekom kasnog dijela svoje karijere, štoviše, čak i dok je držao kolegije iz opće lingvistike, Saussure je slijedio vlastitu "semiotičku" analizu kasne latinske poezije u pokušaju da otkrije namjerno skrivene anagrame vlastitih imena. Metoda proučavanja bila je umnogome suprotna funkcionalnom racionalizmu njegovih lingvističkih analiza: pokušala je, kao što Saussure spominje u jednoj od 99 bilježnica u kojima je nastavio studij, sustavno ispitati problem "slučajnosti", koja " postaje neizbježan temelj svega" (citirano u Starobinski 101). Takva se studija, kako sam Saussure kaže, usredotočuje na "materijalnu činjenicu" slučajnosti i značenja (citirano 101), tako da je "tema-riječ" čiji anagram Saussure traži, kako tvrdi Jean Starobinski, "za pjesnika , instrument, a ne vitalna klica pjesme. Pjesma je dužna ponovno upotrijebiti foničke materijale teme-riječi" (45). U ovoj analizi Starobinski kaže: "Saussure se nije izgubio u potrazi za skrivenim značenjima." Umjesto toga, čini se da njegov rad pokazuje želju da izbjegne sve probleme koji proizlaze iz svijesti: "Budući da poezija nije samo ostvarena u riječima nego je nešto rođeno iz riječi, ona izmiče proizvoljnoj kontroli svijesti kako bi ovisila isključivo o vrsti jezične zakonitosti " (121).

Odnosno, Saussureov pokušaj otkrivanja vlastitih imena u kasnoj latinskoj poeziji - ono što Tzvetan Todorov naziva redukcijom "riječi". . . svom označitelju" (266) - naglašava jedan od elemenata koji je upravljao njegovom lingvističkom analizom, proizvoljnu prirodu znaka. (Također naglašava formalnu prirodu Saussureove lingvistike - "Jezik", tvrdi on, "je oblik, a ne tvar" - što učinkovito eliminira semantiku kao glavni predmet analize.) Kao što Todorov zaključuje, Saussureovo djelo danas se čini izrazito homogenim u svom odbijanju da prihvati simboličke fenomene. . . . U svojim istraživanjima anagrama obraća pozornost samo na fenomene ponavljanja, ne i na one evokacije. . . . U svojim studijama o Nibelunzima on prepoznaje simbole samo kako bi ih pripisao pogrešnim čitanjima: budući da nisu namjerni, simboli ne postoje. Konačno, u svojim kolegijima o općoj lingvistici, on razmatra postojanje semiologije, a time i znakova koji nisu lingvistički; ali ta je afirmacija istodobno ograničena činjenicom da je semiologija posvećena jednoj vrsti znakova: onima koji su proizvoljni. (269-70)

Ako je to točno, to je zato što Saussure nije mogao pojmiti "namjeru" bez subjekta; nije mogao posve izbjeći suprotnost između forme i sadržaja koju je njegov rad toliko doveo u pitanje. Umjesto toga, pribjegao je "jezičnoj zakonitosti". Smješten između, s jedne strane, devetnaestostoljetnih koncepcija povijesti, subjektivnosti i načina uzročne interpretacije kojim upravljaju te koncepcije i, s druge strane, dvadesetostoljetnih "strukturalističkih" koncepcija onoga što je Levi-Strauss nazvao "kantijanizmom bez transcendentalni subjekt" (citirano u Connerton 23) - koncepcije koje brišu suprotnost između forme i sadržaja (ili subjekta i objekta) i hijerarhije prednjeg i pozadinskog plana u potpunom strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici - Ferdinandovo djelo de Saussure u lingvistici i semiotici opisuje signalni trenutak u proučavanju značenja i kulture.

Ronald Schleifer

Dodatak 2

Ferdinand de Saussure (prijevod)

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) smatra se utemeljiteljem moderne lingvistike - zahvaljujući njegovim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i oblika riječi. Uglavnom, temelji strukturalnih metoda u lingvistici i književnoj kritici, au velikoj mjeri i semiotike, postavljeni su u njegovim radovima na samom početku dvadesetog stoljeća. Dokazano je da metode i koncepti takozvanog “poststrukturalizma”, razvijeni u djelima Jacquesa Derride, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih, sežu do lingvističkih radova Saussurea i anagramskih čitanja. kasnog rimskog pjesništva. Treba napomenuti da Saussureov rad na lingvistici i tumačenju jezika pomaže u premošćivanju širokog spektra intelektualnih disciplina, od fizike do književnih inovacija, psihoanalize i filozofije ranog dvadesetog stoljeća. A. J. Greimas i J. Courtet u “Semiotici i jeziku” pišu: “Analitički rječnik s naslovom “Tumačenje” kao nova vrsta tumačenja pojavio se početkom dvadesetog stoljeća uz Saussureovu lingvistiku, Husserlovu fenomenologiju i Freudova psihoanaliza. U ovom slučaju, "interpretacija nije pripisivanje određenog sadržaja formi kojoj bi inače nedostajao; prije je to parafraza koja na drugačiji način formulira isti sadržaj značajnog elementa unutar danog semiotičkog sustava" (159). . U ovom razumijevanju "tumačenja", forma i sadržaj su neodvojivi; naprotiv, svaki je oblik prožet semantičkim značenjem (“smisleni oblik”), pa tumačenje nudi novo, slično prepričavanje nečeg značajnog u drugom znakovnom sustavu.

Slično shvaćanje forme i sadržaja, koje je iznio Claude Lévi-Strauss u jednom od programskih djela strukturalizma, (“Struktura i forma: Razmišljanja o djelima Vladimira Proppa”) može se vidjeti u Saussureovoj posthumno objavljenoj knjizi “Tečaj općenito Jezikoslovlje« (1916., prev., 1959., 1983.). Saussure je za života malo objavljivao; Tečaj, njegovo glavno djelo, sastavljen je iz bilježaka studenata koji su slušali njegova predavanja iz opće lingvistike 1907-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika, suprotstavljajući ga komparativnoj povijesnoj lingvistici devetnaestog stoljeća. Ovo se djelo može smatrati jednim od najvećih dostignuća zapadne misli: uzimajući kao temelj pojedinačne riječi kao strukturne elemente jezika, povijesna (ili "dijakronijska") lingvistika dokazala je podrijetlo i razvoj zapadnoeuropskih jezika iz zajedničkog, Indoeuropski jezik i raniji protoindoeuropski jezik.

Saussure je doveo u pitanje upravo to proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mnogih činjenica o jeziku koje poredbena lingvistika ležerno proučava na mali broj teorema. Komparativna filološka škola 19. stoljeća, piše Saussure, “nije uspjela stvoriti pravu lingvističku školu” jer “nije razumjela bit predmeta proučavanja” (3). Ta "bit", tvrdi on, ne leži samo u pojedinačnim riječima - "pozitivnim supstancama" jezika - već iu formalnim vezama koje pomažu tim supstancama da postoje.

Saussureov "test" jezika temelji se na tri pretpostavke. Prvo: znanstveno razumijevanje jezika ne temelji se na povijesnom, već na strukturnom fenomenu. Stoga je razlikovao pojedine jezične pojave – “govorne događaje”, koje definira kao “parole” – i pravi, po njegovom mišljenju, predmet proučavanja lingvistike, sustav (kod, struktura) koji upravlja tim događajima (“ jezik”). Takvo sustavno proučavanje, štoviše, zahtijeva "sinkronijski" koncept odnosa između elemenata jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz njegovu povijest.

Ova je hipoteza postala preteča onoga što će Roman Jakobson 1929. nazvati "strukturalizmom" - teorijom u kojoj se "bilo koji skup fenomena koji proučava moderna znanost ne smatra mehaničkom akumulacijom, već strukturnom cjelinom u kojoj je konstruktivna komponenta u korelaciji s funkciju” (“Romantična” 711). U ovom odlomku Jakobson je formulirao Saussureovu ideju o definiranju jezika kao strukture, nasuprot "strojnom" nabrajanju povijesnih događaja. Uz to, Jacobson razvija još jednu Saussureovu pretpostavku, koja je postala preteča strukturalne lingvistike: osnovne elemente jezika treba proučavati u vezi ne toliko s njihovim uzrocima, koliko s njihovim funkcijama. Pojedinačne pojave i događaje (recimo, povijest nastanka pojedinih indoeuropskih riječi) ne treba proučavati same za sebe, nego u sustavu u kojemu su u korelaciji sa sličnim sastavnicama. Bio je to radikalan zaokret u usporedbi pojava s okolnom stvarnošću, čije je značenje filozof Ernst Cassirer usporedio sa “znanošću Galileja, koja je u sedamnaestom stoljeću preokrenula ideje o materijalnom svijetu.” Takav zaokret, kako primjećuju Greimas i Kurte, mijenja ideju "tumačenja", a time i sama objašnjenja. Fenomeni se počinju tumačiti ne u odnosu na razloge njihove pojave, već u odnosu na učinak koji mogu imati u sadašnjost i budućnost.Tumačenje je prestalo biti neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, “nesvjesne” u freudovskom smislu riječi).

U svojoj lingvistici Saussure posebno pokazuje taj zaokret u promjeni pojma riječi u lingvistici koju definira kao znak i opisuje u smislu njezinih funkcija. Za njega je znak kombinacija zvuka i značenja, “označeno i oznaka” (66-67; u engleskom prijevodu Roya Harrisa iz 1983. - “označenje” i “signal”). Priroda ove veze je “funkcionalna” (ni jedan ni drugi element ne mogu postojati bez drugog); štoviše, “jedni posuđuju osobine od drugih” (8). Tako Saussure definira glavni strukturni element jezika - znak - i čini temeljem povijesne lingvistike identičnost znakova s ​​riječima, što zahtijeva posebno strogu analizu. Tako da možemo razumjeti različita značenja, recimo, ista riječ "drvo" - ne zato što je riječ samo skup određenih kvaliteta, već zato što je definirana kao element u sustavu znakova, u "strukturnoj cjelini", u jeziku.

Ovaj relativni (“dijakritički”) koncept jedinstva je temelj koncepta svih elemenata jezika u strukturnoj lingvistici. To je posebno jasno u najizvornijem otkriću saussureovske lingvistike, u razvoju koncepta "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje izgovorne i smislene jedinice jezika. Oni nisu samo zvukovi koji se nalaze u jeziku, već "zvučne slike", primjećuje Saussure, koje izvorni govornici doživljavaju kao one koje imaju značenje. (Valja napomenuti da Elmar Holenstein naziva Jakobsonovu lingvistiku, koja nastavlja ideje i koncepte Saussurea prema glavnim odredbama, "fenomenološkim strukturalizmom"). Zbog toga je vodeći govornik praške škole strukturalizma, Jan Mukarovsky, 1937. uočio da “struktura. . . ne empirijski, nego fenomenološki koncept; to nije rezultat sam po sebi, već skup značajnih odnosa kolektivne svijesti (generacije, drugih, itd.)”. Sličnu ideju izrazio je 1960. Lévi-Strauss, vođa francuskog strukturalizma: “Struktura nema određeni sadržaj; ona je sama po sebi smislena, a logična struktura u kojoj je sadržana je otisak stvarnosti.”

S druge strane, fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu, cjelovitu “fenomenološku stvarnost”. Na primjer, u engleskom se glas "t" može izgovoriti na različite načine, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Izgovoren s aspiracijom, s visokim ili niskim usponom jezika, dugi zvuk "t" itd. jednako će razlikovati značenje riječi "to" i "do". Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" su različiti u engleskom, dok su u drugim jezicima varijacije istog fonema (poput engleskog "t", izgovara se aspirirano i neaspirirano). Ogromni vokabular svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika predstavljaju sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, slijedeći Saussurea, Jacobson i N.S. Trubetskoy identificirali su "različite značajke" fonema. Te se značajke temelje na strukturi organa govora - jezika, zuba, glasnica - Saussure to bilježi u Tečaju opće lingvistike, a Harris to naziva "fiziološkom fonetikom" (raniji Baskinov prijevod koristi izraz "fonologija" ) - povezani su u "čvorove » Durg protiv prijatelja kako bi proizvodili zvukove. Recimo, u engleskom, razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom opće lingvističke maksime koju je opisao Saussure: "U jeziku postoje samo razlike." Ono što je važnije nije čak ni ovo: razlika obično podrazumijeva precizne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da smatramo "označavanjem" ili "označenim" - ne postoje koncepti ili glasovi u jeziku koji su postojali prije nego što se jezični sustav razvio.

U takvoj strukturi, jezične analogije nisu definirane svojim inherentnim kvalitetama, već sustavnim (“strukturalnim”) odnosima.

Već sam spomenuo da se fonologija u svom razvoju temeljila na idejama Saussurea. Unatoč činjenici da bi se njegova analiza lingvističke fiziologije u naše vrijeme, prema Harrisu, “nazvala “fizičkom”, za razliku od “psihološke” ili “funkcionalne”, u Tečaju je jasno formulirao smjer i osnovna načela funkcionalnog analiza jezika. Njegovo jedino djelo objavljeno za njegova života, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Bilješke o izvornom samoglasničkom sustavu indoeuropskih jezika), objavljeno 1878., bilo je posve u skladu s komparativnom povijesnom lingvistikom 19. stoljeće. Ipak, Saussure je ovim djelom, kako kaže Jonathan Culler, pokazao “plodnost ideje o jeziku kao sustavu međusobno povezanih pojava, čak i uz njegovu povijesnu rekonstrukciju”. Analizirajući odnose između fonema, objašnjavajući izmjenu samoglasnika u modernim jezicima indoeuropske skupine, Saussure je sugerirao da uz nekoliko različitih zvukova "a" moraju postojati i drugi fonemi koji su formalno opisani. “Ono što je posebno impresivno u Saussureovom radu,” zaključuje Culler, “jest da je gotovo 50 godina kasnije, s otkrićem i dešifriranjem hetitskog klinastog pisma, pronađen fonem, napisan kao “h”, koji se ponašao kako je Saussure predvidio. Kroz formalnu analizu otkrio je ono što je danas poznato kao glotalni zvuk u indoeuropskim jezicima.

U konceptu relativne (dijakritičke) definicije znakova, eksplicitno izraženoj i impliciranoj u Tečaju, postoji treća ključna pretpostavka strukturne lingvistike, koju je Saussure nazvao "arbitrarna priroda znaka". Ono što se time misli je da je odnos između zvuka i značenja u jeziku nemotiviran: s pojmom "drvo" možemo jednako lako povezati riječ "arbre" i riječ "drvo". Štoviše, to znači da je zvuk također proizvoljan: pojam "stabla" možete definirati prisutnošću kore (osim palmi) i veličinom (osim "niskih drvenastih biljaka" - grmova). Iz ovoga bi trebalo biti jasno da se sve pretpostavke koje iznosim ne dijele na više ili manje važne: svaka od njih - sustavna priroda znakova (najrazumljivija u "sinkronom" proučavanju jezika), njihova relativna (dijakritička) bit, proizvoljna priroda znakova – dolazi od ostatka.

Stoga se u saussureovskoj lingvistici fenomen koji se proučava shvaća kao skup usporedbi i kontrasta jezika. Jezik je i izraz značenja riječi (oznaka) i njihov rezultat (komunikacija) – a te se dvije funkcije nikada ne podudaraju (vidi Shleiferovu "Dekonstrukciju jezika"). Možemo primijetiti izmjenu oblika i sadržaja koju Greimas i Courtet opisuju u najnovijoj verziji tumačenja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju na uzastopnim razinama kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u kontrastne morfeme, morfemi u riječi, riječi u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od zbroja svojih dijelova (kao što je voda, u Saussureovom primjeru, više od kombinacije vodika i kisika).

Tri pretpostavke u Tečaju opće lingvistike dovele su Saussurea do ideje o novoj znanosti dvadesetog stoljeća, odvojenoj od lingvistike, koja proučava “život znakova u društvu”. Saussure je ovu znanost nazvao semiologijom (od grčkog “semeion” - znak). "Znanost" semiotike, koja se razvila u istočnoj Europi 1920-ih i 1930-ih te u Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili formulirana) pomoću tih struktura. Također, kasno u svojoj karijeri, paralelno sa svojim kolegijem iz opće lingvistike, Saussure je poduzeo "semiotičku" analizu kasne rimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bio je to pokušaj, kako Saussure piše u jednoj od svojih 99 bilježnica, da se u sustavu prouči problem “vjerojatnosti”, koji “postaje temelj svega. ” Takvo istraživanje, kako sam Saussure tvrdi, pomaže usredotočiti se na "materijalnu stranu" vjerojatnosti; “Ključna riječ”, anagram za kojim Saussure traga, kako tvrdi Jean Starobinsky, “je alat za pjesnika, a ne izvor života pjesme. Pjesma služi da preokrene zvukove ključne riječi.” Prema Starobinskom, u ovoj analizi "Saussure ne ulazi u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna težnja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi generiraju, ona nadilazi kontrolu svijesti i ovisi samo o zakonima jezika.”

Saussureov pokušaj proučavanja vlastitih imena u kasnoj rimskoj poeziji (Tsvetan Todorov nazvao ju je kontrakcijom "riječi... neposredno prije nego što je napisana") naglašava jednu od komponenti njegove lingvističke analize - proizvoljnu prirodu znakova, kao i formalna bit Saussureove lingvistike ("Jezik", tvrdi on, "bit je oblik, a ne pojava"), koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas Saussureovi spisi čine nevjerojatno dosljednima u svojoj nevoljkosti proučavanja simbola [fenomena koji ima jasno definirano značenje]. . . . Proučavajući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne varijante. . . . Proučavajući Nibelungenlied, on identificira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerni, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on sugerira postojanje semiologije koja opisuje više od pukih jezičnih znakova; ali ta je pretpostavka ograničena činjenicom da semilogija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti “namjeru” bez objekta; nije mogao do kraja prevladati jaz između forme i sadržaja – u njegovim se djelima to pretvorilo u pitanje. Umjesto toga, pozvao se na "jezičnu zakonitost". Smješten između, s jedne strane, devetnaestostoljetnih koncepata temeljenih na povijesti i subjektivnom nagađanju, te metoda kontingentnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koje je Lévi-Strauss nazvao “kantijanizam bez transcendentalnog”. agent” - brisanje suprotnosti između forme i sadržaja (subjekta i objekta), značenja i podrijetla u strukturalizmu, psihoanalizi pa čak i kvantnoj mehanici - Radovi Ferlinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i kulturi.

Ronald Shleifer

Književnost

1. Admoni V.G. Osnove teorije gramatike / V.G. Admony; Akademija znanosti SSSR-a.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematičke metode u lingvistici. M., 1974.

4. Arnold I.V. Semantička struktura riječi u suvremenom engleskom jeziku i metode njezina istraživanja. /I.V. Arnold-L.: Obrazovanje, 1966. - 187 str.

6. Bashlykov A.M. Sustav za automatsko prevođenje. / A.M. Bashlykov, A.A. Sokolov. - M.: FIMA LLC, 1997. - 20 str.

7. Baudouin de Courtenay: Teorijska baština i suvremenost: Sažeci priopćenja s međunarodnog znanstvenog skupa / ur. I.G. Kondratieva. - Kazan: KSU, 1995. - 224 str.

8. Gladky A.V., Elementi matematičke lingvistike. / . Gladky A.V., Melchuk I.A. -M., 1969. - 198 str.

9. Golovin, B.N. Jezik i statistika. /B.N. Golovin - M., 1971. - 210 str.

10. Zvegincev, V.A. Teorijska i primijenjena lingvistika. / V.A. Zvegincev - M., 1969. - 143 str.

11. Kasevich, V.B. Semantika. Sintaksa. Morfologija. // V.B. Kasevich -M., 1988. - 292 str.

12. Lekomtsev Yu.K. UVOD u formalni jezik lingvistike / Yu.K. Lekomcev. - M.: Nauka, 1983, 204 str., ilustr.

13. Jezična baština Baudouina de Courtenaya na kraju XX. stoljeća: Sažeci priopćenja međunarodnog znanstveno-praktičnog skupa 15.-18. ožujka 2000. - Krasnojarsk, 2000. - 125 str.

Matveeva G.G. Skrivena gramatička značenja i identifikacija društvene osobe (“portret”) govornika / G.G. Matveeva. - Rostov, 1999. - 174 str.

14. Melchuk, I.A. Iskustvo u izgradnji jezičnih modela "Značenje"<-->Tekst."/ I.A. Melchuk. - M., 1974. - 145 str.

15. Nelyubin L.L. Prevođenje i primijenjena lingvistika/L.L. Nelyubin. - M.: Viša škola, 1983. - 207 str.

16. O egzaktnim metodama istraživanja jezika: o takozvanoj “matematičkoj lingvistici” / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva i dr. - M., 1961. - 162 str.

17. Piotrovsky L.G. Matematička lingvistika: Udžbenik / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaja. - M.: Viša škola, 1977. - 160 str.

18. Isto. Tekst, stroj, čovjek. - L., 1975. - 213 str.

19. Isto. Primijenjena lingvistika / Ed. A.S. Gerda. - L., 1986. - 176 str.

20. Revzin, I.I. Modeli jezika. M., 1963. Revzin, I.I. Moderna strukturalna lingvistika. Problemi i metode. M., 1977. - 239 str.

21. Revzin, I.I., Rosenzweig, V.Yu. Osnove općeg i strojnog prevođenja/Revzin I.I., Rosenzweig, V.Yu. - M., 1964. - 401 str.

22. Slyusareva N.A. Teorija F. de Saussurea u svjetlu moderne lingvistike / N.A. Sljusareva. - M.: Nauka, 1975. - 156 str.

23. Sova, L.Z. Analitička lingvistika/ L.Z. Sova - M., 1970. - 192 str.

24. Saussure F. de. Bilješke o općoj lingvistici / F. de Saussure; Po. od fr. - M.: Napredak, 2000. - 187 str.

25. Isto. Tečaj opće lingvistike / Prijevod. od fr. - Ekaterinburg, 1999. -426 str.

26. Statistika govora i automatska analiza tekst / Odgovor. izd. R.G. Piotrovski. L., 1980. - 223 str.

27. Stoll, P. Setovi. Logika. Aksiomatske teorije./ R. Stoll; Po. iz engleskog - M., 1968. - 180 str.

28. Tenier, L. Osnove strukturne sintakse. M., 1988.

29. Ubin I.I. Automatizacija prevoditeljskih aktivnosti u SSSR-u / I.I. Ubin, L.Yu. Korostelev, B.D. Tihomirov. - M., 1989. - 28 str.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderna matematika. M., 1966.

31. Schenk, R. Konceptualna obrada informacija. M., 1980.

32. Shikhanovich, Yu.A. UVOD u suvremenu matematiku (početni pojmovi). M., 1965

33. Shcherba L.V. Ruski samoglasnici u kvalitativnom i kvantitativnom smislu / L.V. Shcherba - L.: Nauka, 1983. - 159 str.

34. Abdulla-zadeh F. Građanin svijeta // Ogonyok - 1996. - br. 5. - Str.13

35. V.A. Uspenski. Predgovor za čitatelje Nove književne revije semiotičkim porukama Andreja Nikolajeviča Kolmogorova. - Nova književna smotra. -1997. - Br. 24. - Str. 18-23

36. Perlovsky L. Svijest, jezik i kultura. - Znanje je moć. -2000. broj 4 - str. 20-33

Uvod? Teorija prevođenja predavanja