?
如果你能做的好。翻譯PDF文檔是一項非常好完成的任務(wù)。但如果做錯了。對于參與該過(guò)程的每個(gè)人來(lái)說(shuō)。很容易就變成昂貴。耗時(shí)的頭痛。
在本文中。我們將介紹如何在翻譯PDF文檔時(shí)做出正確選擇的指南。涵蓋最常見(jiàn)的錯誤。解釋如何節省成本并在最終結果中考慮質(zhì)量和一致性來(lái)處理整個(gè)PDF翻譯過(guò)程。
什么是PDF?
可移植文檔格式(PDF)。根據其創(chuàng )建者Adobe-“是一種文件格式。用于可靠地呈現和交換文檔。獨立于軟件。硬件或操作系統.PDF現在是由國際標準化組織維護的開(kāi)放標準( ISO)“。
PDF的受歡迎程度可歸功于它的普遍程度。它適用于任何現代企業(yè)。有些甚至依賴(lài)它作為其核心格式。但是這種普遍性的代價(jià)是PDF工作原理的核心。
PDF如何工作?
當處理涉及大量文本。圖像。多種類(lèi)型的字體和圖形的文檔時(shí)。您開(kāi)始面臨不斷增加的源文件大小的問(wèn)題。這最終將導致分發(fā)此類(lèi)文件和其他各種相關(guān)問(wèn)題變得不切實(shí)際兼容性。
PDF的核心是通過(guò)以下方法解決這些問(wèn)題:
通過(guò)多種壓縮方法壓縮源文件。盡可能降低質(zhì)量。
文檔的源格式保持不變。
該文檔是標準化的。使其成為發(fā)布軟件中進(jìn)一步分發(fā)和使用的理想選擇。
支持各種應用程序和操作系統。
這個(gè)過(guò)程的結果是使PDF如此受歡迎的原因 - 你會(huì )收到一個(gè)高度兼容的“扁平”文件。乍一看看起來(lái)和源一樣好。而只是初始大小的一小部分。然而。這是一個(gè)單向的過(guò)程。需要付出代價(jià) - 一旦文檔經(jīng)歷了PDF壓縮過(guò)程。它就無(wú)法逆轉回源并變得不可編輯。
翻譯PDF的最佳方法是處理源文件。PDF文件始終代表文檔的最終版本。因此。處理涉及PDF文件的翻譯的最佳方法是準備好源代碼。
源文件可以來(lái)自各種各樣的軟件應用程序。因為現在幾乎任何東西都允許您以PDF格式保存源文檔。一些創(chuàng )建PDF的最常見(jiàn)程序是Adobe Software Suite / Microsoft Office應用程序/ Open Office / Libre Office等。
擁有源文件的主要好處:
•質(zhì)量- 如果源可用。則翻譯文件的整體質(zhì)量將盡可能接近其原始文檔。
•一致性- 如果目標是擴展并轉換為多個(gè)語(yǔ)言對。則這變得更加相關(guān)。一個(gè)例子:通常用一種語(yǔ)言呈現的文本。一旦翻譯成另一種語(yǔ)言將占用額外的空間。這導致需要使用軟件編輯原始文件。以使一切與布局完美契合。如果源文件不可用。在大多數情況下使用復雜文檔時(shí)。幾乎不可能實(shí)現原始文檔的外觀(guān)。
•字體- 這些是任何文檔的關(guān)鍵元素。本質(zhì)上。字體是可顯示或可打印的文本字符。具有特定的獨特樣式和大小。而且有成千上萬(wàn)的人。有些是免費的。有些是獨特的。有些是為特定目的定制的。有些只使用一種語(yǔ)言。它們都有一個(gè)共同點(diǎn) - 翻譯機構不能擁有它們。另一方面。源文件將具有它們。
•圖像- 任何文檔都可以包含各種大小的圖像。經(jīng)過(guò)PDF壓縮后。這些圖像可能會(huì )丟失高達其初始“數字”大小的95%。PDF主要使用兩種壓縮方法轉換圖像 - JPEG和FLATE。第一個(gè)目標是減少空間。而第二個(gè)目標是在一定程度上保持質(zhì)量。這種壓縮是有代價(jià)的 - 一旦圖像被壓縮和縮小。它們就無(wú)法縮小。根據圖像的類(lèi)型。嘗試將其重新調整大小可能會(huì )導致圖像像素化或模糊。這使得無(wú)法獲得與原始非翻譯文件相當的質(zhì)量。例如。Adobe InDesign格式(.indd)的源文檔可以保持源圖像的完整性。從而可以將它們放置并轉換為新文檔而不會(huì )降低質(zhì)量。
•兼容性- 翻譯機構使用各種工具。如計算機輔助翻譯(CAT)工具。翻譯記憶庫(TM)和許多其他類(lèi)型的軟件??梢蕴岣叻g的速度。質(zhì)量和一致性。同時(shí)降低客戶(hù)的成本。如果源文件不可用。則必須轉換PDF以將其轉換為這些工具支持的格式。
•成本- 源文件使您的翻譯項目立即變得更便宜。如上所述??梢粤⒓刺^(guò)桌面排版(DTP)文件準備過(guò)程中涉及的許多其他步驟。
•時(shí)間- 時(shí)間至關(guān)重要。擁有源文件將保存它。當項目從一個(gè)專(zhuān)家/部門(mén)轉移到另一個(gè)專(zhuān)家/部門(mén)時(shí)。每個(gè)額外的編輯步驟都需要添加潛在的時(shí)區差異。您可能會(huì )有一個(gè)通常需要幾天時(shí)間變成幾周的項目。
如果PDF源不可用怎么辦?
我們完全理解。有時(shí)由于各種原因。源文件不可用。也許你工作的公司非常龐大。部門(mén)之間的溝通很難追查源文件?或者您可能將文檔的設計外包給營(yíng)銷(xiāo)機構。他們對與您共享源文件猶豫不決(這實(shí)際上是一個(gè)非常常見(jiàn)的因素;我們的建議是在他們將項目交付給您時(shí)始終詢(xún)問(wèn)他們的來(lái)源)。
當PDF源不可用時(shí)。這種情況一直發(fā)生。這使得有必要使用多種其他方法從PDF中提取數據并將其轉換為更可編輯的格式。這些方法的使用和應用及其結果在很大程度上取決于PDF本身的質(zhì)量 - PDF營(yíng)銷(xiāo)材料。簡(jiǎn)單文本。技術(shù)電子表格還是簡(jiǎn)單的掃描文檔?這些PDF類(lèi)型中的每一種都需要特殊的轉換方法和方法。
PDF轉換方法:
轉換工具- PDF轉換工具的復雜性。深度。使用的算法以及轉換結果各不相同。但是。所有這些都有一個(gè)目的 - 將PDF從不可編輯的格式轉換為可編輯格式。在許多情況下。為了實(shí)現期望的結果。整個(gè)過(guò)程必須經(jīng)歷多個(gè)轉換階段并應用多個(gè)軟件工具。
OCR- 當文檔中的文本以非標準方式呈現時(shí) - 在一個(gè)角度。在圖像中。對圖像有一些圖形效果。是掃描文檔的一部分 - 它變得無(wú)法選擇。在這些情況下。必須使用OCR(光學(xué)字符識別)。OCR是一種用于識別書(shū)面或數字文本的軟件和硬件工具。OCR掃描文檔的亮區和暗區以獲得可識別的文本/數字模式。并將其與其數據庫進(jìn)行比較。這種方法高度依賴(lài)于正在處理的文件的質(zhì)量。
手工重建- 最后。當沒(méi)有別的東西起作用時(shí)。一切都落到了手工重塑的地步。但你有沒(méi)有試過(guò)模仿別人的筆跡?如果答案是肯定的。那么你肯定知道你的版本。即使看起來(lái)很相似。也會(huì )在某種程度上與原版有所不同。無(wú)論你有多好。這與該方法的情況完全相同。因為它非常依賴(lài)于技能。非常耗時(shí)且成本高昂。其結果最多只能產(chǎn)生幾乎相同的副本。
結論
PDF會(huì )繼續存在。與翻譯相關(guān)的問(wèn)題將始終如一。這就是為什么我們建議您遵循保存文檔源文件的簡(jiǎn)單過(guò)程以防萬(wàn)一。你永遠不知道什么時(shí)候需要翻譯它。當它發(fā)生時(shí)。你就會(huì )準備好。
我們已經(jīng)提出了多項好處。例如降低成本。提高質(zhì)量和不浪費時(shí)間 - 只需保留您希望翻譯的文檔的源文件即可。同時(shí)。輕松避免與手頭沒(méi)有相關(guān)的所有問(wèn)題。
但是。當無(wú)法獲得源文件時(shí)??倳?huì )有其他轉換選項可用于以盡可能接近原始文檔的方式翻譯文檔。
專(zhuān)業(yè)翻譯公司-深圳譯雅馨無(wú)限