作為筆譯員,我們收到各種來源的PDF文件??梢詮膾呙鑸D像,PowerPoint演示文稿和MSWord文檔等創(chuàng)建PDF文件;而且由于CAT工具不接受這些文件類型,我們明顯的第一種選擇是直接在MSWord文件上完成并行轉(zhuǎn)換。但是,如果我們選擇不這樣做并使用CAT工具,我們需要從PDF文件中提取文本,以便在我們的CAT工具中打開它。我們認(rèn)為,使用CAT工具通常對(duì)我們的翻譯工作的需求和最終質(zhì)量都更為有利。
從PDF中提取文本
根據(jù)來源的不同,從PDF中提取文本有多種方式。如果PDF來自MSWord文檔,那么我們需要將我們的PDF保存/轉(zhuǎn)換為我們的首選格式(在我們的例子中是MSWord文檔),并對(duì)格式進(jìn)行必要的更改,如拼寫錯(cuò)誤,間距,等等。
使用預(yù)先桌面發(fā)布過程
但是,如果PDF來自其他來源,如掃描文檔,則需要采用不同的方法。如果您是公司的一員,很可能會(huì)有一個(gè)部門或至少一個(gè)人可以執(zhí)行桌面前發(fā)布任務(wù)以提取文本。然后,一旦預(yù)DTP完成,下一步就是預(yù)編輯該文件。
信實(shí)翻譯公司靠譜嗎做到這一點(diǎn)非常重要,特別是在處理涉及數(shù)字的上下文時(shí)。無論DTP部門/人員的可靠程度如何,總會(huì)有那些不能正確轉(zhuǎn)換并且需要審查的項(xiàng)目。有一個(gè)需要轉(zhuǎn)換為'e'或'l'需要轉(zhuǎn)換為'1'的'c'并不常見,等等。
很顯然,作為一名翻譯人員,您希望您的作品質(zhì)量始終保持高水準(zhǔn),學(xué)習(xí)如何處理PDF只是此過程的一部分。請(qǐng)永遠(yuǎn)不要忘記預(yù)先編輯文件!