枣庄凰怖教育咨询有限公司
廣告服務
|
會員服務
|
展報服務
用戶名
密碼
產品
供應
求購
公司
資訊
展會
首頁
獨家
資訊
圖片
趨勢
技術
應用
專題
文化
展會
供應
求購
公司
要印刷
我的耗材
評論
訪談
專題
話題
印搜動態
國內
國際
環保
視頻
產品導購
活動
展會
設備
印品
世界
行業動態
企業動態
營銷
電子商務
政策法規
統計
商機
印前
印中
印后
包裝
器材
耗材
油墨
膠印
數碼
標簽
CTP
紙箱
創意
絲印
柔印
其他
展會專題
企業專題
資訊專題
技術專題
文化
人物
社會
展會預告
會議預告
展會資訊
國內展會
國際展會
推薦展會
印刷
包裝
絲印
印刷
包裝
絲印
印刷
包裝
絲印
您當前位置:
CPP114首頁
>
新聞頻道
>
國內
>
正文
2019年藍鯨標簽展_藍鯨軟包裝展_藍鯨
2019年7月10日-12日,上海攬境展覽主辦的2019年藍鯨國際標簽展、包裝展...
[詳情]
·
CHINAPLAS 2019 國際橡塑展
·
2019華南國際印刷展
·
2018中國標簽杭州峰會暨紅動傳媒十周年
·
勁豹:用網印魔棒點亮繽紛世界
·
CHINAPLAS 2018
今日排行
本周排行
本月排行
1.
專訪 | 浙江億德曾如高:用“品質+
1.
上海印搜傳媒2024年中秋放假通知
2.
專訪 | 浙江億德曾如高:用“品質+
3.
裁員“賣子”背后,快消行業巨頭艱難轉
4.
展會 | 中秋國慶超長假期,消費高峰
5.
國家藥監局:將蜂膠口腔膜由甲類非處方
6.
數治大消費:金蝶引領快消品行業數字化
7.
制造業向“新”而行 激發高質量發展新
8.
群賢畢至共商政務服務“大事” ——第
9.
澳洲會計師公會:中國財會市場未來有兩
10.
“我與地壇”北京書市開啟 圖書展銷規
1.
中國印工協圖文快印資訊 第11期
2.
“中國印刷及設備器材工業協會2024
3.
標準化良好行為企業風采系列報道之——
4.
活動 | 駕光馭電成偉業,賦能融媒譜
5.
展會 | 第26屆海峽兩岸(龍港)印
6.
展會|11月包裝展亮點搶先看!swo
7.
佳能發布imagePROGRAF系列
8.
功能膜材與軟包裝產業鏈日程定檔:精英
9.
產品推薦|佳能大幅面打印設備煥發茶葉
10.
華新彩印獲評廣東省“省級綠色供應鏈管
【供應】全自動;剞D
【供應】瑪萊寶油墨
·
洈?笅?:
·
【供應】CF56II-NP膠印機
·
【供應】YZP150不干膠標簽印刷機
·
洈TM1400A婮戧窀:
·
【供應】糊盒機
普林太托KF 420*594
杭華油墨UV161 紅色S
東麗版材 WF95DY3
杭華紫外光固化油墨
膠印油墨
膠印材料
絲印材料
電子書亟待高質量轉檔
2012-08-17 09:41 來源:中國新聞出版報 責編:陳培
摘要:
電子書是校對者的噩夢,每當需要將PDF文件轉化為epub格式時,那些原本完美顯示的頁面就會出現一系列令人困惑的排版和格式錯誤。對于出版商和內容供應商來說,在電子書如此暢銷的今天,能夠使PDF文件準確無誤地轉化為epub格式,從而存入電子書閱讀器已經成為亟須關注、亟待解決的問題。
更多精彩資訊>>
小C專訪|正博總經理范
·
緬懷譚老的二三事
·
深度 | 從以紙代塑、單一材料等探索可
·
深度報道 | 聚焦現代化的柔版印刷機
·
產品推薦 | 浩達智能ZFM-1000
小C專訪·煒岡股份董事
【CPP114】
訊:電子書是校對者的噩夢,每當需要將PDF文件轉化為epub格式時,那些原本完美顯示的頁面就會出現一系列令人困惑的排版和格式錯誤。對于出版商和內容供應商來說,在電子書如此暢銷的今天,能夠使PDF文件準確無誤地轉化為epub格式,從而存入電子書閱讀器已經成為亟須關注、亟待解決的問題。
“有人認為轉換PDF格式就像從word文檔里復制文本一樣簡單:只需要選取那些已編好格式的文本并保存就能制作一本電子書。”印度金奈紐貞知識機構的首席執行官大衛·拉杰說。然而,遺憾的是,“PDF文件并不是按照單詞、空格、段落和圖像的邏輯流程來編寫的,也就是說,沒有內在信息可以顯示PDF文本的結構與順序。”
最嚴重且最常出現在電子書中的錯誤是單詞間、標點符號丟失或多余的空格。因為PDF文件并沒有把每一個單詞視作被空格分開的獨立單元,轉換程序通常需要猜測空格從哪里產生。如果猜測錯誤,就會出現一個單詞被分為兩個部分或者兩個單詞連在一起的情況。
另一個問題存在于連字符中。只要轉換軟件需要判定連字符是非強制性的(在文本行末尾,由于該單詞過長,輸入連字符使頁面保持整齊美觀)或強制性的(比如像“e-books”這樣必須使用連字符的單詞),那么就可能出現判定錯誤的情況。
同樣的問題還存在于判定文本格式上:粗體、斜體、下劃線、下標、上標;字體的選擇上:有襯線字體、無襯線字體、傳統字體、現代字體等。在制作PDF文件中字間距、行間距的設置,反白字的使用都會影響轉換結果的準確性。
如果作者沒有使用統一編碼標準的字符,那么這些特殊字符比如非拉丁語字母就成了轉換軟件面臨的又一個困難。對于這些特殊符號而言,建立字符轉換庫是有用的,但是把所有可能出現的字符集結成庫并不現實,所以大多數轉換軟件在遇到特殊字符時會以亂碼的形式呈現。
此外PDF文件還不能識別多列文本。轉換軟件會讀取整個頁面而不是按順序從上到下依次讀取每一列的內容,因此,識別與分列就會導致不同的列線混亂,從而產生完全錯誤的顯示。
與此相似的是,PDF文件沒有強制性分隔段落的概念,這就增加了正文內容混亂或幾個段落連在一起的可能性。另一種情況是,轉換后段落中的每一行都成為獨立的一段,或者是轉換程序會將頁面中的頁眉、頁腳作為正文中的內容進行轉換。
轉換程序最大的挑戰在于如何破解表格、數學方程式以及圖表。將這些元素識別為獨立的單元并與正文分開成為許多轉換軟件不能完成的任務。
在紐貞知識機構,有一種使用自然語言處理和文本識別工具的程序,這種程序用來分析PDF文件文本結構,使用這種程序可以改正PDF文件轉換為epub格式過程中通常出現的錯誤。如今這種產品已經出現——在紐約舉辦的2012TOC數字出版大會上,可以將PDF文件高質量轉換為epub2或3的產品“絲綢”(意為像絲綢一樣流暢光滑)閃亮登場。
據介紹,使用“絲綢”的轉換規則系統可以得到高質量的結果,同時最大限度保持PDF文件原文的風貌。“絲綢”會運行拼寫檢查工具找出連在一起或被分解的單詞,并使用內在連續性檢查工具區分字符。不到一分鐘的時間,“絲綢”就可以對一本標準的300頁圖書完成以上所有工作。接下來,“絲綢”會引導用戶查看它標記的每一處可能出現的錯誤,并將原始的PDF文件與轉化后的電子書進行并排式對比。拉杰同時補充說:“‘絲綢’直觀的界面意味著用戶不需要精通HTML編輯也可以熟練地控制與使用這些功能。腳本處理選項可以快速有效地將PDF文件中出現的自定義或其他復雜的變化轉換為epub/HTML文件。”
目前,“絲綢”正在進行內部測試,拉杰證實這種軟件運營服務模式很快會與廣大客戶見面。在更為復雜的PDF文件與電子書版面設計問世之前,我們無疑需要更先進的解決方法,將零錯誤的電子書和用戶對電子書質量的高滿意度作為奮斗目標,將驅使轉換工具研發朝著更快、更可靠、更自動化的方向發展。
分享到:
下一篇:
“精密達杯”印后裝訂明星企業結果出爐
相關新聞:
·
索尼推新型電子書閱讀器:整合社交網絡
2012.08.17
·
[圖]哈佛醫學院研究小組在DNA模型中成功編碼電子書
2012.08.17
·
市場新形勢 電子書曲線走高
2012.08.16
·
電子書城應用字節社在App Store被下架
2012.08.16
【我要印】印刷廠與需方印務對接,海量印刷訂單供您任意選擇。
【cpp114】印刷機械、零配件供求信息對接,讓客戶方便找到您。
【我的耗材】采購低于市場價5%-20%的印刷耗材,為您節省成本。
【印東印西】全國領先的印刷品網上采購商城,讓印刷不花錢。
封面智能制造報道 |
東風印刷做減法
人頭馬X.O煥新包裝首
勁豹尋匠人精神
關于我們
|
聯系方式
|
誠聘英才
|
幫助中心
|
意見反饋
|
版權聲明
|
媒體秀
|
渠道代理
滬ICP備18018458號-3
法律支持:
上海市富蘭德林律師事務所
Copyright © 2019
上海印搜文化傳媒股份有限公司
電話:18816622098