Kolokacija – tekstynų lingvistikoje yra žodžių ar sąvokų, kurie kartu aptinkami dažniau, nei gali būti tikimasi, seka.

Frazeologijoje kolokacija yra frazemos potipis. Frazeologinės kolokacijos pavyzdys, pateikiamas Maiklo Halidėjaus (Michael Halliday), yra posakis stipri arbata. Nors ta pati reikšmė gali būti perteikta apytikriu ekvivalentu galinga arbata, tokį posakį anglakalbiai laiko neįprastu ir keistu. Priešingai, technologijos srityje atitinkamas posakis galingas kompiuteris yra tinkamesnis nei stiprus kompiuteris.

Frazeologinės kolokacijos neturėtų būti painiojamos su frazeologizmais, nes frazeologizmo reikšmė yra sutartinė, kuri ką nors implikuoja, o kolokacija tiesiog tėra dažnai vartojamas žodžių junginys.

Automatinis kolokacijų nustatymas yra kompiuterinė priemonė, su kuria dokumente arba tekstyne randamos kolokacijos naudojant įvairius kompiuterinės lingvistikos elementus, panašius į duomenų išgavimą.

Išplėstas apibrėžimas

redaguoti

Kolokacijos yra iš dalies arba visiškai pastovūs posakiai, kurie dažnai vartojami konkrečiame kontekste. Tokie terminai, kaip „skaidrus kaip krištolas“, „branduolinė šeima“ ir „kosmetinė chirurgija“, yra susijusių žodžių porų pavyzdžiai.

Kolokacijos gali turėti sintaksinį (pavyzdžiui, veiksmažodis–objektas: „priimti“ ir „sprendimą“), leksinį (pavyzdžiui, antonimija) ar lingvistiškai neapibrėžtą ryšį. Žinios apie kolokacijas atskleidžia kalbos išmanymą: jeigu nebus atsižvelgta į žodžių junglumą, sakinys atrodys keistai, net jeigu jis ir būtų gramatiškai taisyklingas. Tai lemia susidomėjimą kolokacijomis kalbų mokymosi procese. „Google Play“ parduotuvėje neseniai paskelbta mobilioji kolokacijų žodyno versija.[1]

Tekstynų lingvistika tiksliai nustato raktinį žodį kontekste (angl. KWIC – Key Word In Context) ir iškart nurodo šalia jo esančius kitus žodžius. Taip apibūdinama žodžių vartosena.

Kolokacijų nustatymas apima tam tikrus parametrus, iš kurių pats svarbiausias yra asociacijos priemonė; ji įvertina, ar vartosena kartu yra tik atsitiktinė, ar statistiškai reikšminga.

Dėl neatsitiktinės kalbos prigimties dauguma kolokacijų yra įvertinamos kaip reikšmingos, o asociacijos įverčiai paprastai naudojami rezultatams grupuoti. Dažnai naudojamos asociacijos priemonės apima tarpusavio informaciją, t įverčius ir logaritminio tikėtinumo santykį.

Užuot pasirinkęs vieną apibrėžimą, Gledhilas[2] teigia, kad kolokacija apima mažiausiai tris skirtingus požymius:

  1. sutapimą, t. y. statistinį vaizdą: kolokacija laikoma žodžių junginio pasikartojimu tekste;
  2. konstrukciją: pagal šį požymį kolokacija laikoma arba koreliacija tarp leksemos ir leksinio-gramatinio modelio, arba ryšiu tarp pagrindinio junginio dėmens ir kolokatų;
  3. išraišką: pragmatiniu požiūriu kolokacija – tai įprastas posakis neatsižvelgiant į formą. Svarbu pabrėžti, kad šie skirtingi požymiai kontrastuoja su frazeologijos studijose įprasta kolokacijos samprata. Tradiciškai kalbant, kolokacija paaiškinama atsižvelgiant kartu į visus tris požymius tokia tvarka:

„Laisvasis junginys“ ↔ „Apstabarėjusios kolokacijos“ ↔ „Sustabarėjusios idiomos

Kolokacijos žodynuose

redaguoti

1933 m. Haroldas Palmeris (Harold Palmer) Second Interim Report on English Collocations[3] išryškino kolokacijų svarbą. Jis pabrėžė, kad dėl kolokacijų kalba besimokančiajam užsienio kalbos skamba natūraliai. Taigi nuo 1940-ųjų informacija apie pasikartojančius žodžių junginius tapo standartine besimokančiųjų vienakalbių žodynų savybe. Kai šie žodynai tapo labiau orientuoti į frazes, o ne į žodžius, atkreiptas didesnis dėmesys į kolokacijas. Tokia tendencija išryškėjo nuo XXI amžiaus dėl prieinamumo prie didelių tekstynų ir pažangių tekstynams pritaikytoms programinės irangos, pvz., Sketch Engine, su kuriomis galima sistemingai atsižvelgti į kolokacijas, esančias žodynuose. Naudojantis šiais įrankiais, tokiuose žodynuose, kaip Macmillan English Dictionary ir Longman Dictionary of Contemporary English, pateikiami dažnų kolokacijų sąrašai.

Taip pat yra specialiųjų žodynų, skirtų aprašyti kolokacijas kalboje. Jie apima (ispanų kalbai) Redes: Diccionario combinatorio del español contemporaneo (2004), (prancūzų) Le Robert: Dictionnaire des combinaisons de mots (2007), (anglų) the LTP Dictionary of Selected Collocations (1997) ir the Macmillan Collocations Dictionary (2010)[4].

Statistiškai reikšmingos kolokacijos

redaguoti

Stjudento t-testas (Student‘s t-test) gali būti naudojamas nustatyti, ar tekstyne aptikta kolokacija yra statistiškai reikšminga.

Taip pat skaitykite

redaguoti

Šaltiniai

redaguoti
  1. Programėlė – Collocation Dictionary [1]
  2. Gledhill C. (2000): Collocations in Science Writing, Narr, Tübingen
  3. Palmer, H. E. (1933). Second Interim Report on English Collocations, Submitted to the Tenth Annual Conference of English Teachers under the Auspices of the Institute for Research in English Teaching. Tokyo, Institute for Research in English Teaching.
  4. „Macmillan Collocation Dictionary - How it was written - Macmillan“. macmillandictionaries.com. Suarchyvuotas originalas 2018-12-21. Nuoroda tikrinta 2018-12-20.