20240618版本
- text的base_64赋值 “meaningless”
- IMAGE的text添加caption
- 合并chunk时将👆IMAGE的caption一起合为new_chunk
- 增加text_list字段收集用于合并的chunk,它可能包含文本和图片的caption
- positions里加入image的位置信息
- base64_list字段List[str]:存储base_64列表
processor 687行
文档解析
20240618版本
processor 687行
文档解析