fbpx
OCR ประหยัดเวลาพิมพ์เอกสาร

OCR ประหยัดเวลาพิมพ์เอกสาร

Optical Character Recognition (OCR) คือ เทคโนโลยีที่ช่วยแปลงเอกสารกระดาษที่มีข้อความ รูปภาพที่มีข้อความ หรือ PDF ที่มีข้อความ ที่ไม่สามารถแก้ไขได้ ให้อยู่ในรูปแบบการประมวลผลคำที่เป็นข้อความที่แก้ไขได้ สามารถนำมาจัดรูปแบบเอกสารใหม่ได้ เหมาะสัมหรับผู้ที่ต้องการนำข้อความจากหนังสือ เอกสาร หรือไฟล์ PDF มาใช้งานโดยไม่ต้องพิมพ์ใหม่ หรือเสียเวลาในการพิมพ์เอกสารลดลง เช่น นักศึกษาปริญญาโทต้องการใช้ทฤษฎีจากหนังสือเล่มหนึ่ง เขาก็นำหนังสือไปสแกนให้อยู่ในรูปแบบของไฟล์ JPEG หรือ PDF จากนั้นก็นำมาเข้าสู่กระบวนการ OCR โดยใช้ซอฟต์แวร์ที่มีชื่อว่า ABBYY Fine Reader โดยมีขั้นตอนดังนี้

1. ไปที่ Open

2. เลือกไฟล์ PDF

3. คลิก Open

4. รอสักครู่จนสแกนเสร็จ

5. คลิกที่ Dropdown List แล้วเลือกปลายทางที่ต้องการ เช่น Save as Microsoft Word Document

6. เลือกที่จัดเก็บไฟล์

7. ตั้งชื่อไฟล์

8. คลิก Save

หากเราไปดาวน์โหลดเอกสาร PDF ซึ่งมีการเข้ารหัสล็อคไว้ ทำให้ไม่สามารถคัดลอกข้อความจาก PDF มาใช้งานต่อได้ ให้ Capture หรือ Print Screen หน้าจอแล้วบันทึกเป็นไฟล์รูปภาพ จากนั้นนำมาเข้าโปรแกรม ABBYY FineReader ข้อความที่ต้องการก็จะปรากฏขึ้น สามารถคัดลอกไปแก้ไขต่อใน Word ได้ และที่สำคัญ รองรับการทำงานกับภาษาไทยได้ถึง 90%

การทำ OCR นั้น เป็นเพียงวิธีที่่วยลดระยะเวลาในการพิมพ์เอกสารเท่านั้น ดังนั้นเมื่อเรามีการนำข้อความที่แต่งโดยผู้อื่นมาใช้ในงานของเรา เราต้องอ้างอิงที่มาตามหลักการอ้างอิงให้ชัดเจน เช่น การอ้างอิงแบบตัวเลข หรือการอ้างอิงแบบ APA เป็นต้น ซึ่งการทำงานเอกสารที่ดีนั้นจะต้องนำข้อความจากเอกสารที่ได้มาสังเคราะห์และเรียบเรียงใหม่ โดยยังคงความหมายเดิมจากต้นฉบับ เพื่อป้องกันการโจรกรรมทางผลงานวิชาการ (Plagiarism)