← Repo Trendingallenai/olmocr
★ 18.2kPYTHONPRODUKTIVITAS
Buat apaOlmoCR adalah toolkit untuk mengonversi dokumen PDF menjadi teks terstruktur berkualitas tinggi menggunakan model bahasa multimodal, dirancang khusus untuk memproses dokumen ilmiah dan akademik dalam skala besar.
Cocok buatCocok buat peneliti, data engineer, dan tim AI yang butuh pipeline ekstraksi teks dari PDF secara massal untuk melatih atau menyiapkan dataset model bahasa besar.
Lihat di GitHub →