Beranda » Unduhan Perangkat Lunak Gratis » Ekstrak Teks dari File PDF dan Gambar

    Ekstrak Teks dari File PDF dan Gambar

    Punya dokumen PDF yang ingin Anda ekstrak semua teks? Bagaimana dengan file gambar dari dokumen yang dipindai yang ingin Anda konversi menjadi teks yang dapat diedit? Ini adalah beberapa masalah paling umum yang pernah saya lihat di tempat kerja ketika bekerja dengan file.

    Pada artikel ini, saya akan berbicara tentang beberapa cara berbeda yang dapat Anda lakukan untuk mencoba mengekstrak teks dari PDF atau dari gambar. Hasil ekstraksi Anda akan bervariasi tergantung pada jenis dan kualitas teks dalam PDF atau gambar. Selain itu, hasil Anda akan bervariasi tergantung pada alat yang Anda gunakan, jadi yang terbaik untuk mencoba sebanyak mungkin opsi di bawah ini untuk mendapatkan hasil terbaik.

    Ekstrak Teks dari Gambar atau PDF

    Cara termudah dan tercepat untuk memulai adalah dengan mencoba layanan ekstraktor teks PDF online. Ini biasanya gratis dan dapat memberi Anda apa yang Anda cari tanpa harus menginstal apa pun di komputer Anda. Berikut adalah dua yang telah saya gunakan dengan hasil yang sangat baik hingga sangat baik:

    ExtractPDF

    ExtractPDF adalah alat gratis untuk mengambil gambar, teks dan font dari file PDF. Satu-satunya batasan adalah ukuran maksimum untuk file PDF adalah 10 MB. Itu agak kecil; jadi jika Anda memiliki file yang lebih besar, coba beberapa metode lain di bawah ini. Pilih file Anda dan kemudian klik Kirim file tombol. Hasilnya biasanya sangat cepat dan Anda akan melihat pratinjau teks ketika Anda mengklik pada tab Teks.

    Ini juga merupakan manfaat tambahan yang bagus yang mengekstrak gambar dari file PDF juga, kalau-kalau Anda membutuhkannya! Secara keseluruhan, alat online berfungsi dengan baik, tetapi saya telah menemukan beberapa dokumen PDF yang memberi saya hasil yang lucu. Teks diekstraksi dengan baik, tetapi untuk beberapa alasan akan ada satu baris setelah setiap kata! Bukan masalah besar untuk file PDF pendek, tetapi tentu saja masalah untuk file dengan banyak teks. Jika itu terjadi pada Anda, coba alat berikutnya.

    OCR online

    OCR online biasanya cenderung berfungsi untuk dokumen yang tidak dikonversi dengan benar dengan ExtractPDF, jadi itu ide yang baik untuk mencoba kedua layanan untuk melihat mana yang memberikan Anda hasil yang lebih baik. OCR online juga memiliki beberapa fitur yang lebih bagus yang dapat berguna bagi siapa saja dengan file PDF besar yang hanya perlu mengonversi teks pada beberapa halaman daripada keseluruhan dokumen..

    Hal pertama yang ingin Anda lakukan adalah melanjutkan dan membuat akun gratis. Agak menyebalkan, tetapi jika Anda tidak membuat akun gratis, itu hanya akan mengkonversi sebagian PDF Anda daripada seluruh dokumen. Selain itu, alih-alih hanya dapat mengunggah dokumen 5 MB, Anda dapat mengunggah hingga 100MB per file dengan akun.

    Pertama, pilih bahasa dan kemudian pilih jenis format output yang Anda inginkan untuk file yang dikonversi. Anda memiliki beberapa opsi dan Anda dapat memilih lebih dari satu jika mau. Dibawah Dokumen berganda, Anda dapat memilih Nomor halaman dan kemudian pilih hanya halaman yang ingin Anda konversi. Kemudian Anda pilih file dan klik Mengubah!

    Setelah konversi, Anda akan dibawa ke bagian Dokumen (jika Anda masuk) tempat Anda dapat melihat berapa banyak halaman gratis yang tersisa dan tautan untuk mengunduh file yang dikonversi. Sepertinya Anda hanya memiliki 25 halaman gratis sehari, jadi jika Anda membutuhkan lebih dari itu, Anda harus menunggu sebentar atau membeli lebih banyak halaman.

    OCR online melakukan pekerjaan yang sangat baik untuk mengkonversi PDF saya karena ia mampu mempertahankan tata letak teks yang sebenarnya. Dalam pengujian saya, saya mengambil dokumen Word yang menggunakan peluru, ukuran font yang berbeda, dll dan mengubahnya menjadi PDF. Kemudian saya menggunakan OCR Online untuk mengubahnya kembali ke format Word dan sekitar 95% sama dengan aslinya. Itu cukup mengesankan bagi saya.

    Plus, jika Anda ingin mengonversi gambar menjadi teks, maka OCR Online dapat melakukannya semudah mengekstraksi teks dari file PDF.

    OCR Online Gratis

    Karena berbicara tentang gambar ke teks OCR, izinkan saya menyebutkan situs web bagus lain yang bekerja sangat baik pada gambar. OCR Online Gratis sangat bagus dan sangat akurat ketika mengekstraksi teks dari gambar pengujian saya. Saya mengambil beberapa foto dari iPhone saya halaman-halaman dari buku, pamflet, dll dan saya terkejut melihat seberapa baik itu dapat mengkonversi teks.

    Pilih file Anda dan kemudian klik tombol Unggah. Di layar berikutnya, ada beberapa opsi dan pratinjau gambar. Anda dapat memotongnya jika Anda tidak ingin OCR semuanya. Kemudian cukup klik tombol OCR dan teks Anda yang dikonversi akan muncul di bawah pratinjau gambar. Ini juga tidak memiliki batasan, yang sangat bagus.

    Selain layanan online, ada dua konverter PDF freeware yang ingin saya sebutkan jika Anda memerlukan perangkat lunak yang berjalan secara lokal di komputer Anda untuk melakukan konversi. Dengan layanan online, Anda akan selalu memerlukan koneksi Internet dan itu mungkin tidak memungkinkan untuk semua orang. Namun, saya perhatikan bahwa kualitas konversi dari program freeware secara signifikan lebih buruk daripada situs web.

    A-PDF Text Extractor

    A-PDF Text Extractor adalah freeware yang melakukan pekerjaan mengekstraksi teks dari file PDF dengan cukup baik. Setelah Anda mengunduhnya dan menginstalnya, klik tombol Buka untuk memilih file PDF Anda. Kemudian klik Ekstrak teks untuk memulai proses.

    Ini akan meminta Anda lokasi untuk menyimpan file output teks dan kemudian akan mulai mengekstraksi. Anda juga dapat mengklik Pilihan tombol, yang memungkinkan Anda memilih hanya halaman tertentu untuk mengekstraksi dan jenis ekstraksi. Opsi kedua menarik karena mengekstrak teks dalam tata letak yang berbeda dan ada baiknya mencoba ketiganya untuk melihat mana yang memberi Anda hasil terbaik.

    PDF2Text Pilot

    PDF2Text Pilot melakukan pekerjaan mengekstraksi teks. Itu tidak memiliki opsi; Anda tinggal menambahkan file atau folder, berkonversi dan berharap yang terbaik. Ini bekerja dengan baik pada beberapa PDF, tetapi bagi sebagian besar dari mereka, ada banyak masalah.

    Cukup klik Tambah File, lalu klik Mengubah. Setelah konversi selesai, klik Browse untuk membuka file. Jarak tempuh Anda akan bervariasi menggunakan program ini jadi jangan berharap banyak.

    Juga, perlu disebutkan bahwa jika Anda berada di lingkungan perusahaan atau bisa mendapatkan salinan Adobe Acrobat dari kantor, maka Anda benar-benar bisa mendapatkan hasil yang jauh lebih baik. Acrobat jelas tidak gratis, tetapi memiliki opsi untuk mengkonversi PDF ke format Word, Excel dan HTML. Itu juga melakukan pekerjaan terbaik untuk mempertahankan struktur dokumen asli dan mengkonversi teks yang rumit.