Skip to main content

四個小時,失敗紀錄⋯⋯

 開學,例行下載新的電子版教材。

好消息是,現在的https://basic.smartedu.cn/elecEdu?defaultTag=fa6200b8-b4aa-4d72-bebb-dddd93022a13%2Fd1914cee-dbcc-44e6-bab3-74eeed0e9875%2F0a724f60-913a-4c39-90a3-f9ce4c899e7b直接inspect就可以在網頁標籤下載原文件,去年7月時,還必須登陸必須自己修改鏈接纔可以。

下完,犯懶,想直接讓機器做去年和今年同一本教材的文件對比。

四個小時折騰後,失敗。


命令行方式:

brew install poppler

pdftotext file1.pdf file1.txt
pdftotext file2.pdf file2.txt

diff file1.txt file2.txt
導出文件沒有對比意義⋯⋯

細化下
brew install wdiff colordiff aha
wdiff -3 file1.txt file2.txt | colordiff | aha > diff_output.html

依舊沒意義。

更換思路,找來i-net PDFC,前幾十頁效果很驚艷,能直接標示出第六頁學習提示內有沒有刪除引文出處的區別,也標示了去年和今年,從“詠歌”到“永歌”的變化。但全本左右的對接還是不夠智能,對比意義也就上述兩點。
明顯可見的是排版有變化,以阿Q為例,舊版一行的字數要少於新版一行字數。
好消息是,新版終於刪除了右下角隱藏的“統編版”水印。

前幾天下了Adobe Acrobat DC一直猶疑裝不裝,為對比,裝;結果兩個文件對比後直接不能導出⋯⋯廢。

折騰完,想想,何必呢。反正每一課都已經被我網頁化,慢慢逐課校對,和學生讀到哪就校到哪,就可以了。
網頁,是有版本記錄的。我每一次更動,自然就是版本的變化說明了。

嗯。

把教材扔學生大群,收工。
其實,想折騰的,可以自己下載i-net PDFC,拆分pdf成為50頁的幾個文件,做對比,會很容易也很可觀。

Comments