Keresés
Keresés
2010. szeptember 8., szerda




tlogo

tlogo


PDF-dokumentumok kezelése, avagy kínlódás egy problémás dokumentumformátummal

Gyakran előfordul, hogy a megrendelők Adobe Acrobat PDF-formátumban küldik el a fordítandó anyagot. Tájékozottságuktól is függ, hogy mit várnak vissza: a szöveges részek fordítását vagy egy ugyanúgy kinéző PDF-dokumentumot, csak más nyelven.A fordítást elvállaló ügynökség vagy fordító feladata, hogy az elvárást a megrendeléskor pontosan tisztázza, hogy később ne legyen félreértés. Ha az eredetivel megegyező kinézetű dokumentumot kérnek tőle, akkor ennek előállítása a fordítás költségét jelentősen megfejelő kiadványszerkesztési költségekkel járhat. A feleknek tisztában kell lenni azzal, hogy a kiadványszerkesztés nem a fordító feladata (nem is a szakmája), és nincs benne a fordítás árában.

A formátum sajátosságai

Az 1990 óta fejlesztett PDF-ről olvasható a magyar forgalmazó honlapján:
Az Adobe Acrobat szoftver kiváló lehetőséget kínál azon üzleti, kreatív és tervező szakemberek számára, akik biztonságosan és hatékonyan szeretnének dokumentumokkal dolgozni. Itt a lehetőség PDF (Adobe Portable Document Format) készítésére bármilyen iratból – akár néhány gombnyomással.
 
Az Adobe által több éve fejlesztett PDF technológia mára már az egész világon elismert és népszerű módja az elektronikus dokumentumkezelésnek. A PDF formátumban készített munkák pontosan ugyanazt a látványt nyújtják Windows, Macintosh, Unix vagy Palm rendszereken. Emellett a dokumentumok megtartják a szöveg tulajdonságait, a használt betűtípusok beágyazódnak a fájlba, így a dokumentumokban könnyedén kereshetünk a számunkra fontos információkra. Akár más multimédiás és interaktív elemeket is beépíthetünk, mint pl. hiperlink, űrlap, nyomógombok, film, animáció, zene, stb...
 
A PDF technológia a kis fájlméret mellett a biztonságáról lett híres. A dokumentumainkat könnyedén védhetjük az illetéktelen felhasználástól. Megtilthatjuk a dokumentum megnyitását, részeinek másolását, nyomtatását, stb...
 
Az Adobe PDF fejlődésével eljutott arra a szintre, hogy teljes egészében átvegye az irodai papírmunkák szerepét elektronikus formában.
 
A PDF fő célja tehát a különféle eredetű dokumentumok univerzális megjelenítése, nem a szerkesztése. Ebben az értelemben tehát leginkább a dokumentum nyomtatott változatához hasonlítható, és fordítóként is – a formátum kezelésének a problémáit előrevetítve – így érdemes gondolnunk rá, azaz mintha a forrásnyelvi szöveget kinyomtatva kapnánk meg, papíron.A PDF-fájlok megjelenítéséhez elég az ingyenes Acrobat Reader, előállításukhoz azonban már az Adobe Acrobat nem éppen olcsó teljes verziója szükséges. A piacon számos olcsóbb vagy ingyenes program is kapható (pl. NitroPDF, pdf995, primoPDF), amellyel PDF-fájlok előállíthatók, noha nem biztos, hogy az eredeti csomag minden funkcióját (pl. összes biztonsági opció) kínálják.
 
Ha megnézzük, hogy mi mindenből állítható elő PDF-állomány: 
  • fájlból (bármilyen kinyomtatható szöveg- vagy képállomány),
  • weboldalból,
  • lapolvasóból,
  • vágólapra másolt képből
akkor láthatjuk, hogy a forrásként használt állományok között vannak, amelyek felülírásra, illetve fordítástámogató program használatára alkalmatlanok (kép, lapolvasó). Hiába néz ki szövegnek a PDF-állomány, ha valójában egy újságlap beszkennelt képe.

PDF-állományok konvertálása fordításhoz

Noha kaphatók szoftverek, amelyekkel a nem képből létrehozott állományok szerkeszthetők, például az Infit vagy a Foxit PDF Editor, ezek inkább az állományok kisebb módosítására valók, nem pedig hosszabb anyagok teljes átszerkesztésére.
Az Adobe Acrobat újabb verziói (nem a Reader, hanem a teljes verzió) már lehetővé teszik, hogy a PDF-állományt szerkeszthető állományba mentsük, például Word dokumentummá. Ez azonban nem működik akkor, ha a PDF nem szerkeszthető szövegállományból lett létrehozva (pl. lapolvasó) vagy feliratos képeket (pl. folyamatábrák) tartalmaz, vagy ha a biztonsági beállításainál letiltották a szövegkinyerés lehetőségét.
 
A szöveg fordításhoz való előkészítésének általánosan alkalmazható módszerénél abból kell kiindulnunk, hogy az állomány tulajdonképpen egy nyomtatott kép. A nyomtatott képek szöveggé alakítását optikai karakterfelismerő (OCR) programokkal végezhetjük el, amelyek újabb verziói a PDF-állományokat is közvetlenül kezelni tudják. Azaz nincs szükség a PDF-ek kinyomtatására, majd lapolvasóval való beolvasására. Általános vélemény szerint a FineReader az egyik legjobb ilyen alkalmazás. Ugyanez a cég készített egy olcsóbb célalkalmazást is, kifejezetten a PDF-állományok konvertálására, a PDF Transformert. Bővebb funkcióválasztéka miatt azonban érdemes a teljes verziót megvásárolni.
 
Összetettebb szerkezetű PDF-fájlok esetén megfontolandó, hogy a szövegfelismerés alkalmazása után, amikor a program Word dokumentumba menti az anyagot, tekintsünk el a PDF eredeti elrendezésének teljes megőrzésétől. Annak érdekében ugyanis, hogy a Wordbe konvertált fájl minél jobban hasonlítson az eredeti PDF-hez, a Word dokumentumban oszlopok, rejtett táblázatok, szövegdobozok, különleges stílusok, betűméretek és betűformázások jelennek meg, sokszor lehetetlenné téve az állomány felülírását. Előfordulhat, hogy akár egyetlen szó beírása nyomán szétesik az egyébként tökéletesen kinéző állomány.

Fordítómemória használata agyonformázott szövegeknél

Előfordulhat, mint például a karakterfelismerő programmal előállított Word dokumetumoknál, hogy egy dokumentum formázása annyira bonyolult, hogy a Trados vagy a Wordfast nem használható a Wordben (pl. szövegdobozok túltengése miatt nem látható a szöveg, vagy szétesik a szerkezete a beszúrt forrásszegmensek miatt).
 
Ilyenkor segíthet a Trados T-Window for Clipboard, amely mindig a vágólapra másolt szöveget tekinti forrásszegmensnek. Ez a program a Trados 5.5 verziójánál jelent meg egy több programból álló ún. T-Window gyűjtemény részeként (pl. Excel, Powerpoint állományok kezelésére), de ma már a TagEditor megnyitja az Microsoft Office egyéb fájljait is, ezért a 7.x verzióban csak ez a kiegészítés maradt meg a T-Window gyűjteményből. Gyakorlatilag bármely programmal használható, amely kezeli a vágólapot, akár a PDF fent említett, de nem javasolt közvetlen szerkesztésénél is. Ez azonban mégis inkább csak kényszermegoldás, hiszen szegmensenként kezeli csak a fordítást, az nem látható át egészében, a forrás- és célszegmensek nem kereshetők stb.

Összefoglalás

A hordozható dokumentumformátumnak tartott PDF (portable document format) a fordító számára sokszor inkább problémás dokumentumformátumnak bizonyul. A PDF-formátum célja a megjelenítés, ezt a feladatát kiválóan megoldja, de nem tekinthető szerkeszthető formátumnak.
Ezzel a megrendelőnek is tisztában kell lennie. Ha az eredeti PDF formátumához hasonló fordítást szeretne kapni, akkor vagy adja át a PDF forrásául szolgáló szerkeszthető, azaz a fordító által felülírható állományt, pl. Word dokumentumot, vagy fizesse meg annak újraelőállítását. A fordítás és a kiadványszerkesztés két külön szakma, mindegyik feladatot arra kell bízni, aki a legjobban ért hozzá.


Környei Tibor








A fordit.hu a Magyarországi Fordítóirodák Egyesületének média partnere.