🎯 功能特点
- ✅ 文本提取:直接从PDF中提取文字内容
- ✅ 页数限制:最多支持20页PDF文件
- ✅ 中英双语:支持中文简体和英文混合识别
- ✅ 分页整理:按页面分组,便于阅读和查找
- ✅ 格式保留:保持原有文档结构和段落格式
⚠️ 使用限制:
文件要求:
• 仅支持包含文本内容的PDF文件(不支持扫描件)
• 文件页数限制:最多20页
• 文件大小限制:最大16MB
支持的PDF类型:
• ✅ 文本型PDF:包含可直接提取的文字内容
• ❌ 扫描件PDF:仅包含图片,需要OCR识别
• ❌ 图像型PDF:主要内容为图片格式
注意事项:
• 如果PDF页面无法提取文字,将显示"[该页面无文本内容]"提示
• 建议使用包含文字的PDF文件以获得最佳效果
• 识别的文字准确率取决于原始PDF文件质量