Upravljanje terminologijom: njemačko-hrvatska terminološka baza s područja automobilske tehnike / Terminology Management: German-Croatian computational terminology database in the domain of car manuals PDF

Title Upravljanje terminologijom: njemačko-hrvatska terminološka baza s područja automobilske tehnike / Terminology Management: German-Croatian computational terminology database in the domain of car manuals
Author Ivan Nekić
Pages 52
File Size 2.1 MB
File Type PDF
Total Downloads 195
Total Views 905

Summary

SVEUČILIŠTE U ZAGREBU FILOZOFSKI FAKULTET ODSJEK ZA INFORMACIJSKE ZNANOSTI Upravljanje terminologijom: njemačko-hrvatska terminološka baza s područja automobilske tehnike diplomski rad Ivan Nekić Mentor: dr. sc. Sanja Seljan, izv. prof. Zagreb, listopad 2011. Sadržaj Uvod ..............................


Description

SVEUČILIŠTE U ZAGREBU FILOZOFSKI FAKULTET ODSJEK ZA INFORMACIJSKE ZNANOSTI

Upravljanje terminologijom: njemačko-hrvatska terminološka baza s područja automobilske tehnike diplomski rad

Ivan Nekić

Mentor: dr. sc. Sanja Seljan, izv. prof.

Zagreb, listopad 2011.

Sadržaj Uvod .................................................................................................................... 3 1. O TERMINOLOGIJI ...................................................................................... 5 Što je terminologija? ....................................................................................... 5 Upravljanje terminologijom ............................................................................ 7 Različiti pristupi terminologiji ........................................................................ 8 2. TERMINOLOŠKI ALATI ............................................................................ 10 Pregled terminoloških alata ........................................................................... 10 SDL MultiTerm kao logičan izbor alata ........................................................ 13 Pregled SDL Tradosa i mogućnosti MultiTerma .......................................... 14 3. TERMINOLOŠKE BAZE NA WEB-U ....................................................... 17 Primjeri online terminoloških baza na hrvatskom jeziku .............................. 26 4. PRAKTIČNI DIO – ISTRAŢIVANJE ......................................................... 29 Polazni materijal: dvojezični korpus i prijevodna memorija ......................... Priprema prijevodne memorije za MultiTerm ............................................... Automatska ekstrakcija termina: uvoz u MultiTerm Extract ........................ Analiza termina dobivenih automatskom ekstrakcijom ................................ Ručno izdvajanje termina .............................................................................. Korištenje dobivene baze ..............................................................................

29 30 33 39 40 42

Zaključak ........................................................................................................... 44 Bibliografija ...................................................................................................... 46 Prilog 1: Popis termina iz izraĎene baze abecednim redom prema hrvatskom jeziku ................................................................. 49

I. Nekić, Upravljanje terminologijom…

1

Kazalo slika i tablica Slika 1 Neujednačena terminologija kod Microsofta ............................................................... 6 Slika 2 NeusklaĎen opis proizvoda ........................................................................................... 6 Slika 3 Semaziološki (lijevo) i onomaziološki pristup terminologiji (desno) .......................... 9 Slika 4 Središnja uloga upravljanja terminologijom ............................................................... 16 Slika 5 Le grand dictionnaire terminologique ........................................................................ 17 Slika 6 IATE formular za pretraţivanje .................................................................................. 18 Slika 7 IATE: rezultati pretraţivanja za pojam „translation memory“ ................................... 19 Slika 8 Terminometro: Terminonauta ..................................................................................... 20 Slika 9 FAO Term Portal: rezultati pretraţivanja za „sustainability“ .................................... 21 Slika 10 UNTERM: dokumenti koji sadrţe izraz „human rights“ ......................................... 22 Slika 11 METEOTERM: prijevodi izraza „(climate change) impact assessement“ .............. 23 Slika 12 Naslovnica portala ProZ.com za registrirane korisnike ............................................ 24 Slika 13 Javno dostupna TermWiki baza sadrţi gotovo 290.000 pojmova ............................ 25 Slika 14 MultiTerm Online ..................................................................................................... 25 Slika 15 EVROTERM obuhvaća i pojmove na hrvatskom .................................................... 26 Slika 16 Eurovoc: prijevodi pojma „pojmovnik“ ................................................................... 27 Slika 17 HIDRA - Četverojezični rječnik prava Europske unije ............................................ 27 Slika 18 Baza e-ghetaldus posvećena je matematičkoj terminologiji ..................................... 28 Slika 19 Svojstva korištene Wordfastove prijevodne memorije ............................................. 29 Slika 20 Pregled korištene TM u Wordfastu .......................................................................... 30 Slika 21 Izvoz TM iz Wordfasta u TMX ................................................................................ 31 Slika 22 Prikaz jednog pojma u MultiTermu .......................................................................... 32 Slika 23 Prvi korak uvoza prijevodne memorije u MT Extract .............................................. 33 Slika 24 Drugi korak: odabir postojeće terminološke baze (dodavanje termina) ili jezičnog para za novu bazu .................................................................................. 34 Slika 25 Treći korak: odabir ulaznih TMX datoteka .............................................................. 34 Slika 26 Baza ili popis izraza koje ne ţelimo kao kandidate za nove termine ....................... 35 Slika 27 Peti korak: postavke za ekstrakciju termina ............................................................. 36 Slika 28 Postavke koje se odnose na prijevod ........................................................................ 36 Slika 29 Sve postavke za automatsku ekstrakciju na jednom mjestu ..................................... 37 Slika 30 Validacija kandidata za termine nakon automatske ekstrakcije ............................... 38 Slika 31 Različiti gramatički oblici riječi javljaju se kao različiti prijevodi .......................... 38 Slika 32 Dio prihvaćenih kandidata za termine ...................................................................... 39 Slika 33 Dodavanje novog pojma u MultiTerm kroz Translator's Workbench ...................... 41 Slika 34 Unos dodatnih polja prije pohrane u MultiTerm bazu ............................................. 41 Slika 35 Crvenom linijom iznad Workbench obiljeţava prepoznate termine iz baze, a prijevod se pojavljuje u prostoru desno .................................................... 42 Slika 36 Višejezična baza s ilustracijom i hipervezom ........................................................... 43

Tablica 1 Pregled alata za ekstrakciju terminologije .............................................................. 11 Tablica 2 Razlike u TMX datotekama Wordfasta i SDL Tradosa (značajne razlike istaknute podebljano) .................................................................... 32

I. Nekić, Upravljanje terminologijom…

2

Uvod Ovaj diplomski rad predstavlja dovršetak dodatnoga dvogodišnjega studija društveno-humanističke informatike (DHI), započetoga prema predbolonjskome programu minule 1998. godine. Budući da sam studirao jezike (dvopredmetni studij njemačkoga i talijanskoga jezika i knjiţevnosti), te se već niz godina honorarno bavim prevoĎenjem, u dogovoru s mentoricom odabrao sam temu rada koja će povezati jezik (tj. prevoĎenje) i informatiku (prijevodne alate). Katkada se, u razgovoru meĎu kolegama germanistima i talijanistima neinformatičarima, na spomen teme strojnoga prevoĎenja, čuje zabrinuto pitanje koje svjedoči o potrebi bolje integracije prevoditeljstva i informatike: „Hoćemo li mi onda ostati bez posla?“. Danas je posao prevoditelja, kao uostalom i mnoga druga zanimanja, nemoguće zamisliti bez uporabe računala. S druge strane, osim moţda u nekim vrlo ograničenim slučajevima, gdje je moguće posve automatizirano strojno prevoĎenje, profesionalni prevoditelji još će dugo biti potrebni, pod uvjetom da su sposobni koristiti suvremena računalna pomagala. U najosnovnijoj funkciji računalo prevoditelju, kao i svima koji se bave pisanjem, zamjenjuje pisaći stroj, omogućujući pohranu, izmjene, pretraţivanje teksta i još mnogo toga što izlazi iz okvira ove teme. Specifična pomoć u prevoĎenju su prijevodne memorije (engl. translation memory, TM), danas praktički nezaobilazne, jer se uporabom odgovarajućih alata izbjegava potreba višekratnog prevoĎenja identičnih ili sličnih segmenata teksta. Drugo veliko područje strojno potpomognutoga prevoĎenja (engl. computeraided translation, CAT) su rječnici, pogotovo oni specijalizirani za uţa strukovna područja, najčešće višejezični. Alat kojim se bavimo u ovom radu sluţi upravo tomu: upravljanju terminologijom (engl. terminology management) pomoću terminološke baze (engl. termbase). SDL MultiTerm danas je jedan od najraširenijih alata za tu namjenu. Ovim radom ţeli se pokazati vaţnost uporabe prevoditeljskih alata (engl. Computer-assisted translation tools, CAT tools) za upravljanje terminologijom općenito, zatim dati pregled rješenja za ekstrakciju i upravljanje terminologijom, uz I. Nekić, Upravljanje terminologijom…

3

poseban osvrt na SDL MultiTerm, koji je korišten u praktičnom dijelu ovog rada. U praktičnom dijelu bit će opisan konkretan postupak izrade jedne dvojezične (njemački i hrvatski) terminološke baze s područja automobilske tehnologije (tekst namijenjen široj publici). Koristit će se metode automatske (tj. potpomognute) ekstrakcije terminologije, kao i ručno popunjavanje terminološke baze iz prijevodne memorije. IzraĎena baza bit će priloţena radu u digitalnom obliku, očekujući da će imati i praktičnu uporabnu vrijednost. Odabrani programski paket danas je jedan od najzastupljenijih, kako u velikim multinacionalnim tvrtkama, tako i na sveučilištima i u javnim institucijama. Metoda rada, nakon konverzije prijevodne memorije preko TMX formata, obuhvaća i automatsku i ručnu ekstrakciju terminologije. Pri tome je bilo prisutno više ograničenja, od nedostatka dokumentacije i literature, pogotovo na hrvatskom jeziku, do nedostupnosti pune funkcionalne novije inačice samoga alata (terminološka baza u prilogu izraĎena je pomoću programskoga paketa SDL Trados 2007, i paketa MultiTerm Extract u demo verziji). Osim toga, baza nije popunjavana (i korištena) tijekom prevoĎenja, nego naknadno, tijekom izrade ovoga diplomskog rada. Osnovni nedostatak ovoga rada je što baza nije raĎena na dovoljno velikom korpusu da bi mogla obuhvatiti sve pojmove toga područja. Rad se sastoji od 2 osnovna dijela. U prvome dijelu (poglavlja 1 do 3) je riječ o terminologiji općenito i o upravljanju terminologijom (engl. terminology management); donesen je pregled terminoloških alata, gdje je detaljnije prikazan SDL MultiTerm te nekoliko javno dostupnih terminoloških baza na webu. U drugome dijelu (poglavlje 4) prikazan je praktični dio rada uz opis postupka automatske i ručne ekstrakcije termina iz pripremljene prijevodne memorije.

I. Nekić, Upravljanje terminologijom…

4

1. O TERMINOLOGIJI Što je terminologija? Terminologija kao terminološka znanost „predmetno je područje koje istraţuje ustrojstvo, oblikovanje, razvoj, uporabu i upravljanje nazivljem u različitim predmetnim područjima i koje priprema metodološke temelje za mnoge primjene.“1 MeĎutim, riječ „terminologija“ označava i skup izraza (termina) karakterističnih za neko područje, npr. „vojna terminologija“, „filozofska terminologija“, „ţeljeznička terminologija“ i sl. Isto tako podrazumijeva i aktivnost prikupljanja, opisivanja i prezentiranja termina.2 Termini su riječi i izrazi koji označavaju proizvode, usluge, postupke i u pravilu predstavljaju stručni ţargon nekoga specifičnoga područja industrije, tehnologije ili znanosti. Termini se ne ograničavaju samo na imenice ili imenske skupove, nego mogu biti i frazeološke cjeline koje sadrţe i glagolske izraze. Prema ISO definiciji, termin je „opis odreĎenoga pojma u nekom jeziku lingvističkim izrazom“.3 Upravljanje terminologijom povećava preciznost i konzistentnost svakoga prijevodnoga projekta standardizirajući termine i smanjujući nekonzistentnost unutar „proizvodnoga lanca“ procesa prevoĎenja.4 Ponekad se postavlja pitanje je li konzistentnost termina protivna autorskoj slobodi prevoditelja, tj. ograničava li ona njegovu kreativnost i umanjuje li bogatstvo jezičnoga izraţaja? Drugim riječima, je li nuţno jedan stručni pojam izvornoga jezika uvijek prevoditi istim stručnim pojmom ciljnoga jezika, odnosno moramo li hardware uvijek prevoditi kao sklopovlje ili kao očvrsje5, a operating system kao operacijski

UNESCO: Smjernice za terminološke politike, Pariz, 2005., str. 3. URL: http://www.infoterm.info/pdf/activities/guidelines/SmjerniceZaTerminoloskePolitike_hr.pdf (21.09.2011.). 2 Usp. Wikipedia: Terminology. URL: http://en.wikipedia.org/wiki/Terminology (21.09.2011.). 3 ISO 1087-1:2000: Terminology work -- Vocabulary -- Part 1: Theory and application 4 Usp. What is Terminology? URL: http://www.sdl.com/en/language-technology/products/terminologymanagement/what-is-terminology-management/default.asp (21.09.2011.). 5 Starčević I., Hardver još nije «sklopovlje». URL: http://www.nacional.hr/clanak/12005/hardver-josnije-laquosklopovljeraquo (10.10.2011.). Kao sinonimi pojma hardware navode se: „hardver, očvrsje, sklopovlje, sklopovi, strojevina, sklopovska oprema, sklopovska konfiguracija računala, materijalna osnovica, sklopovska podrška, sklopovska osnova, oprema, ţeljezarija, računalna oprema, raditelj, tehnička oprema“. Usp. Mihaljević M., Hrvatsko i englesko računalno nazivlje, u: Jezik. Časopis za kulturu hrvatskoga književnog jezika, god. 53., br. 2., str. 43., URL: http://hrcak.srce.hr/file/25194 (10.10.2011.). 1

I. Nekić, Upravljanje terminologijom…

5

sustav ili su dopuštene i inačice: operativni sistem, hardver…? Teško je povući jasnu granicu, ali evo dva očita primjera nekonzistentnoga prijevoda: u novome operacijskom sustavu Windows 7, kod postavki zvučnika, izraz „surround“ jednom je ostavljen nepreveden, a drugi put je to „prostorno ozvučenje“ (vidi sliku 1), meĎutim bi uz oznake „5.1“ i „7.1“ trebao stajati isti tekst.

Slika 1 Neujednačena terminologija kod Microsofta

U oglasnom letku jednoga trgovačkog lanca na slici 2 ključevi su u naslovu „viličasto okasti“, a kasnije „vilasto-okasti“.

Slika 2 NeusklaĎen opis proizvoda

I. Nekić, Upravljanje terminologijom…

6

Upravljanje terminologijom Upravljanje terminologijom (engl. terminology management, TM) dio je globalnog upravljanja informacijama (engl. global information management, GIM). U današnjem

globaliziranom

svijetu

prednjače

multinacionalne

kompanije

kao

proizvoĎači/distributeri proizvoda namijenjenih globalnom trţištu. One vrlo često imaju vlastite odjele za prevoĎenje i terminologiju, usko povezane kako s razvojem tako i marketingom. No jednako tako i agencije za prevoditeljske (i s njima povezane) usluge nastoje djelovati globalno, okupiti veći broj vlastitih i samostalnih (engl. freelance) prevoditelja za više jezika, kako bi mogle zadovoljiti zahtjeve svojih klijenata. Uslijed sve više specijalističkih područja i inovacija raste potreba za specijaliziranim rječnicima. Veliki prijevodni projekti rade se na mnogo jezika usporedno s multijezičnom terminologijom, a rad se distribuira na veći broj prevoditelja. U takvom je kontekstu upravljanje terminologijom ključno za učinkovitu komunikaciju na globalnoj razini, kako unutar (multinacionalne) kompanije, tako i prema klijentima. Ono tako omogućuje bolju internu komunikaciju, olakšava globalnu isporuku proizvoda (istovremenu jezičnu pripremljenost za sva trţišta), smanjuje troškove prijevoda, olakšava usklaĎivanje s propisima i standardima, ubrzava prevoĎenje, omogućuje usklaĎenost „brenda“ i povećava kvalitetu sadrţaja.6 Rad na terminologiji, dakle, ne započinje u fazi prevoĎenja, nego na samom početku pisanja dokumentacije o nekom proizvodu, tj. u fazi razvoja. Ukoliko je to učinjeno temeljito, s dosljednom i jednoznačnom terminologijom, posao prevoĎenja bit će lakši i jeftiniji, a kvaliteta popratnih informacija urodit će većim zadovoljstvom kupca.7 Ukoliko se pristupi prevoĎenju, a terminologija još nije definirana, do ujednačenoga nazivlja dolazi se tek nakon više skupih ponavljanja. MeĎutim ako je definirana terminologija u izvornom jeziku, agencija zaduţena za lokalizaciju (engl. SDL. What is Terminology: Why is it important to manage terminology?“ URL: http://www.sdl.com/en/language-technology/products/terminology-management/what-isterminology-management/default.asp#manageterminology (21.09.2011.). 7 „Keeping translation costs low starts at the very beginning of the source language (SL) product. You realize you need to compile your documentation according to translation purposes and apply the single-source concept for printed documentation and online help. With user interface (UI) text as well, predefined terminology keeps translation costs low. High customer satisfaction is synonymous to high quality and can only be achieved by comprehensive testing and having a product prepared for localization or internationalization.“ Müller E., Building Quality into the Localization Process, u: MultiLingual, April/May 2009., str. 14. URL: http://www.multilingual.com/issueDetail.php?issue=103 (21.09.2011.). 6

I. Nekić, Upravljanje terminologijom…

7

multilanguage provider) definira termine u ostalim jezicima, te nema potrebe za ponavljanjem prijevoda zbog terminoloških nedostataka, što bi uzrokovalo gubitak vremena

i

novca.8

Opširnije

obrazlaganje

potrebe

proaktivnoga

upravljanja

terminologijom sa ţivopisnim primjerima moţe se naći u online članku „10 dobrih razloga za upravljanje Vašom terminologijom“.9 Prema jednom istraţivanju iz 1998., promjena jednoga termina u prijevodnoj memoriji za softver i dokumentaciju bez sustava upravljanja terminologijom uzrokuje troškove u visini od otprilike 2000 USD za samo jedan jezik.10

Različiti pristupi terminologiji Kad se terminologija jednostavno biljeţi u nekom elektroničkom obliku (npr. xls tablici ili čak tekstualnom dokumentu), to je pristup ad hoc i moţe posluţiti jednome prevoditelju ili manjem timu za manje zahtjevne projekte. Daleko je kvalitetnije rješenje sustavno upravljanje terminologijom.11 Sustavan pristup podrazumijeva da su unosi u bazu usredotočeni na pojam, a ne na termin (jezični izraz), što se naziva onomaziološkim pristupom. U semaziološkom pristupu jedan izraz moţe imati više značenja, tj. označavati različite stvarnosti (npr. homonimija: „atmosfera“ je Zemljin omotač ali i ozračje u grupi ljudi). Onomaziološka pak metoda u središte stavlja jednu stvarnost (misaoni pojam), kojemu moţe biti pridruţeno više izraza u jednome jeziku (sinonimija), odnosno prijevodi na različite jezike. Standardizirana terminologija podrazumijeva odabir (ili bar preporuku) jednoga izraza u svakom jeziku.12

8

Usp. isto., str. 15. Usp. CSOFT International, 10 Good Reasons to Manage Your Terminology: URL: http://www.csoftintl.com/solutions_localization_terminology_management_10_good_reasons_intro.p hp (21.09.2011.). 10 Martin and Karsch 2001:19, prema: Zielinski D., „Terminology management: Principles, Simple forms of terminology management“, u: Seminar on Computer-Aided Translation, Universidad de Málaga, rujan 2007. URL: http://ecolotrain.unisaarland.de/download/sdv/malaga2007/slides/02_terminologyPrinciples.pdf (21.09.2011.). 11 Pristup i osnovna načela upravljanja terminologijom opisana su prema Bertaccini F., Modelli di schede terminologiche per traduttori e interpreti, webinar odrţan u travnju 2008. URL: http://www.translationzone.com/en/resources/downloads/webinar-recordings/webinar-suterminologia.asp (21.09.2011.). 12 Usp. isto. Vidi takoĎer prezentaciju: Vintar...


Similar Free PDFs