The Curious' Blog

Cuma sampah di Dunia Maya inih.. Kadang-kadang curhatan ga jelas.. Atau sedikit dokumentasi, sekedar pengingat sajah...

11:36 PM

Convert Banyak File PDF ke TXT di Linux

Posted by The Curious

Halo Halo Halo, apa kareba kawan semua. Ihik Ihik. Lagi di Ponorogo nih. Iseng-iseng ngenet sampe subuh, daripada ga ada kerjaan nulis-nulis dikit buat dokumentasi yaah.. Hehehehehe... Judulnya tuh di atas. Ceritanya gini nih, saya dapet kerjaan. Di Suruh convert banyak File Ebook dalam format PDF, yaitu Ebook BSE Diknas, diminta di rubah ke format txt. JAdi ceritanya gini, Ebook BSE Diknas tersebut akan dibaca oleh tuna netra. Berhubung ORCA (Screen Reader di Linux) tidak dapet membaca ebook dalam format PDF, maka saya harus merubah semua ebook ke dalam text.

Anda bisa membayangkan dong, duileeee.. Ebook sebanyak gaban gitu di convertin satu-satu make Adobe REader yang Save a copy as text. Duilee.. Kapan kelarnya. Wakwakwak.. Iya gak? Uya gak? Iya gak?Setelah nanya-nanya, nyari-nyari, dan coba-coba akhirnnya nemu nih command na di linux. Pada tau kan pdftotxt di linux? Yang main-main pake console itu tuuh.. Nah itu bisa kita manfaatin. Kita gabungin make sed dan awk. Apakah sed dan awk itu? Keekekekekek. Tanya Om Google aja yah. Saja juga ga ngartos-ngartos amat sii.. Kekekekekeke

Langsung aja, gabungan sed, awk, dan pdftotxt menjadi handal buat konvert banyak file pdf ke text deh. Di jamin halal. Kekekek

Kek gini nih commandnya :

#find *.pdf | sed "s/^/\'/;s/$/\'/" | awk -F. '{print "pdftotext " $0}' | sh

Syarat nya, kamu harus ada di satu folder yang sama dengan lokasi file PDF nya. Lalu nanti di folder tersebut lah file txt nya juga akan di taruh

Selamat mencoba. :)

Happy Hacking ;)

Special Thx to : Deanrt. :D, Nurrahmadie. :D



0 comments: