樓主: 笨羊
打印 上一主題 下一主題

請教 pdf 檔字型取代 [複製鏈接]

Rank: 9Rank: 9Rank: 9

31#
發表於 2015-12-7 22:01:06 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
alex.chen 發表於 2015-12-7 21:29
1. 以幾十M的檔案上傳Google Docs出現問題來說,實在令人費解!
2. 請停用Chrome Adobe外掛,使用Chrome 原 ...

我檢查了 Chrome 外掛程式,應該是使用 Chrome PDF Viewer 沒錯!

這樣的話,Chrome 也沒轍了!

佛法如是我聞,道心順其自然。佛為體,道為用。天人合一,萬物寂滅。

使用道具 舉報

Rank: 9Rank: 9Rank: 9

32#
發表於 2015-12-7 22:03:57 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
alex.chen 發表於 2015-12-7 21:59
這個情況應該是您在 抓出2頁另存一個測試檔 時,已將該檔轉存為內嵌圖片!
上傳時只要選擇不要進行自動轉換 ...


這個 2頁的測試檔,是我要提供給大家測試,剛剛才抓出來的。

我檢查過,與原 pdf 檔一樣,有「原先的內嵌字型」。
佛法如是我聞,道心順其自然。佛為體,道為用。天人合一,萬物寂滅。

使用道具 舉報

Rank: 9Rank: 9Rank: 9

33#
發表於 2015-12-7 22:07:35 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
本帖最後由 alex.chen 於 2015-12-7 22:10 編輯

看來沒有原始檔,恐怕是很難幫上忙了!
建議您還是提供原始檔,再產出部分測試檔,只會把問題複雜化!
1

查看全部評分

使用道具 舉報

Rank: 9Rank: 9Rank: 9

34#
發表於 2015-12-7 22:09:42 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
alex.chen 發表於 2015-12-7 21:59
這個情況應該是您在 抓出2頁另存一個測試檔 時,已將該檔轉存為內嵌圖片!
上傳時只要選擇不要進行自動轉換 ...

> 上傳時只要選擇不要進行自動轉換為Google Docs

還沒到「完成上傳」階段,就「當」在網頁上,無法選擇「不要進行自動轉換為Google Docs」。
佛法如是我聞,道心順其自然。佛為體,道為用。天人合一,萬物寂滅。

使用道具 舉報

Rank: 9Rank: 9Rank: 9

35#
發表於 2015-12-7 22:32:22 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
本帖最後由 笨羊 於 2015-12-8 00:33 編輯
alex.chen 發表於 2015-12-7 22:07
看來沒有原始檔,恐怕是很難幫上忙了!
建議您還是提供原始檔,再產出部分測試檔,只會把問題複雜化!


小弟把測試檔放在 mega裡:(問題已解決,就刪除測試檔了。)

請大夥下載,幫忙測試囉!
佛法如是我聞,道心順其自然。佛為體,道為用。天人合一,萬物寂滅。

使用道具 舉報

Rank: 9Rank: 9Rank: 9

36#
發表於 2015-12-7 23:48:19 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
文件文字編碼都是自訂,相當複雜.
系統字型編號完全不同,無法取代.

試一下另存新檔,存成HTML網頁來copy文字.
因頁面會從新拆解,需些時間,但比OCR快了.
您先1-2頁看看是否可以.
2

查看全部評分

使用道具 舉報

Rank: 9Rank: 9Rank: 9

37#
發表於 2015-12-8 00:30:50 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
本帖最後由 笨羊 於 2015-12-8 07:50 編輯
copy 發表於 2015-12-7 23:48
文件文字編碼都是自訂,相當複雜.
系統字型編號完全不同,無法取代.


感謝 copy 大提供的「大智慧」指引,終於解決了!實在太感謝了!

雖然無法「直接替換」pdf 檔嵌入的字型,也無法「保留」原有 pdf 檔的格式,
不過,已經可以「充分利用」原 pdf 檔的文字內容了!

1. 首先用 Adobe Acrobat Pro 9 開啟原 pdf 檔,
用 Adobe PDF 列印成另一個新 pdf 檔。再用 Adobe Acrobat Pro 9 打開如下:



2. 再利用 Adobe Acrobat Pro 9 另存他檔,存成 HTML 3.2 格式(HTML 4.01應該也可以)。
用瀏覽器打開,如下:



就可以 mark 並 copy 文字了。
(雖然有部份文字「替換錯誤」,或者可能是「辨識錯誤」,
譬如「陳氏」變「區氏」、「富沃」變「富決」、「棲畝」變「棲敵」,但比自己 OCR快多了。)

如果直接用原 pdf 檔轉存 html檔,還是亂碼。
必須先用 Adobe PDF 列印新 pdf檔,再轉存 html 檔才行。

雖然不清楚原因,不過能用就夠了!
太感謝了!感謝大夥幫忙!謝謝 copy大!
1

查看全部評分

佛法如是我聞,道心順其自然。佛為體,道為用。天人合一,萬物寂滅。

使用道具 舉報

Rank: 9Rank: 9Rank: 9

38#
發表於 2015-12-8 18:11:15 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
笨羊 發表於 2015-12-8 00:30
感謝 copy 大提供的「大智慧」指引,終於解決了!實在太感謝了!

雖然無法「直接替換」p ...

我使用X pro可以直接以您的測試頁轉html.
文字校對也挺累的!加加油.

一直在想是用什麼軟體做?猜不透文件作者的編碼為何要如此?

Simple Life  隨心所意 自由自在

使用道具 舉報

Rank: 9Rank: 9Rank: 9

39#
發表於 2015-12-8 18:28:06 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
copy 發表於 2015-12-8 18:11
我使用X pro可以直接以您的測試頁轉html.
文字校對也挺累的!加加油.

因為測試頁是經過 Adobe Acrobat Pro 9 開啟原 pdf 檔,
抓出 1,2頁用 Adobe PDF 列印成另一個新 pdf 檔的,
已經過第一個步驟,所以再存成 html檔就可以了。

我從原 pdf檔看文件內容描述,應該是用 Adobe Acrobat 11.0.3 製作。

佛法如是我聞,道心順其自然。佛為體,道為用。天人合一,萬物寂滅。

使用道具 舉報

Rank: 9Rank: 9Rank: 9

40#
發表於 2015-12-8 22:37:10 |只看該作者.....載入全部圖片 用LINE傳送 . 分享到FB
笨羊 發表於 2015-12-8 18:28
因為測試頁是經過 Adobe Acrobat Pro 9 開啟原 pdf 檔,
抓出 1,2頁用 Adobe PDF 列印成另一個新 pdf 檔 ...

我剛試了一下另存新檔-存文字,也可以速度快上百倍.
存文字的頁面有個設定鈕,進入後~


編碼(UTF-8)
輸出格式及縮減取樣皆可.
要不要試一下?文字應無誤.
1

查看全部評分

Simple Life  隨心所意 自由自在

使用道具 舉報

2home站內搜尋



回覆:請教 pdf 檔字型取代

您需要登錄後才可以回帖 登錄 | 註冊成會員

Archiver|手機版|2home 打造桃花源

GMT+8, 2024-9-22 13:59 , Processed in 0.061597 second(s), 9 queries
免責聲明:2home網站是以即時上傳留言的方式運作,一切留言內容只代表發言者個人意見,非本網站之立場,2home網站對所有留言的真實性、完整性及立場等,不負任何法律責任。 .

回頂部