18.1.08

Thủ thuật nhỏ trích xuất Tiếng Việt trong các tập tin PDF

ImageQua bao nhiêu lần tìm kiếm phần mềm chuyển đổi các văn bản
.PDF sang định dạng văn bản .DOC (Word) có hỗ trợ Tiếng Việt nhưng
không lần nào mình vừa ý bởi tỉ lệ thành công không đạt 100% nên rất
tốn thời gian để kiểm tra lại.



Thực ra, có một cách khác dễ hơn rất nhiều mã lại đơn giản. Đó là bạn
upload tập tin PDF tiếng Việt cần trích vào GMail sau đó mở mail chứa
tập tin đính kèm PDF đó và nhấp vào liên kết View HTML nặm cạnh liên kết Download.



Image



Cách này giúp bạn xem toàn bộ tập tin PDF dứơi dạng web. Do môi trường
Web hỗ trợ tối đa Unicode nên Tiếng Việt thể hiện rất tốt. Bạn chỉ cần
Copy đọan nào bạn muốn lấy và dán vào Word.



Image



Chúc thành công!


{emailalert}


{mos_ri:pdf} 

18 comments:

VĂN THỤ said...

Chào anh Hiển thủ thuật hôm nay đúng là hay thật đậy anh ạ ;D ;D Để em thử xem sao hiiiiiiiii

VĂN THỤ said...

Hay Lắm Các Bạn ơi Nhưng Nó Không Hiểm Thị Hình Ảnh Được ;D ;D

bibo said...

hì! hạn cchế của nó là kong hiển thị được hình ảnh! ;D

VĂN THỤ said...

uhm nhưng dù sao cũng thật hay

chengbn said...

phải nói các thủ thuật trong Helloict rất hay

rendom said...

Chỉ có thế thôi giờ em đã hiểu ;D

lenguyentoan said...

Tuyệt. Chiêu này hay đó. :D :D :D :D :D :D

SuDo said...

Woa! Chiêu này rất hay. Cám ơn BiBo nhiều nhé!

ctu1010166 said...

Cũng khá tốt, nhưng có vài nhận xét đây:
1) Như các bạn đã nói thì nó không hiển thị hình ảnh.
2) Việc view khá chậm, tôi đã thử convert file PDF 140 trang thì chỉ view, copy và paste được 70 trang. Do vậy, nếu cần hiển thị nhanh và chính xác, các bạn nên chọn những trang cần trích văn bản mà thôi. Bây giờ trình cho phép chọn trang trong PDF khá nhiều, các bạn có thể nghiên cứu thêm! :)

vldh said...

Chả hiểu người post bài thành công vì lý do gì, nhưng thử test mấy file pdf lên thử nghiệm thì toàn lỗi lỗi và lỗi font

bibo said...

Oh! mọi người làm cũng thành công mà! bạn thử share tập tin PDF mà bạn làm k thành công xem! Để mọi nguoi cùng test nhé! :)

trungnam said...

Tôi thường sử dụng các tài liệu về toán học, các phần mềm chuyển từ PDF sang Word thì bó tay, thủ thuật này cũng bó tay luôn, vì các công thức toán học đều bị mã hóa. Các bạn có cách khác không, giúp tôi với!

bibo said...

Các công thức toán học khi chuyển sang PDF đều được chuyển sang dạng hình ảnh hết. Do đó bạn sẽ khó tìm thấy giải pháp chuyển đổi 100% cho tài liệu có công thức toán học!

dats85 said...

Chiêu này được lắm
Nhưng nếu tài liệu dạng PDF nó có hàng nghìn trang thì sao. Liệu có cách nào cắt và chỉ lấy những trang mình cần được không?

bibo said...

Bạn thử dùng Công cụ biên tập tài liệu PDF tất cả trong một ngay bên ứơi bbài viết thử xem.

Huyhoang1 said...

Tôi đã dùng cách này và thấy rất hay nhưng có điều là đối với toán học thì công thức không chuyển dược . Nếu bạn nào có chiêu nào bày cho minh với. Kính chào

nibi said...

Rat hay doi voi tai lieu khong nhieu, nhung nhieu trang thi kho su dung. Cam on ban !

dongpn123 said...

các TL có nhiều trang thì ko hiện thị được