OGeek|极客世界-中国程序员成长平台

标题: ios - CGPDFStringGetBytePtr 在扫描 pdf 时返回不正确的字符串 [打印本页]

作者: 菜鸟教程小白    时间: 2022-12-12 15:15
标题: ios - CGPDFStringGetBytePtr 在扫描 pdf 时返回不正确的字符串

我有一份 PDF,我正在尝试使用 CGPDFScanner 扫描 PDF。 在扫描 pdf 时,遇到单词“file”时,CGPDFStringGetBytePtr API 返回“\x02le”。 PDF 具有 Type1 字体并且没有 ToUnicodeMapping(CMap)。 PDF 中不存在编码字典,因此使用 NSUTF8String 编码。但是我尝试了所有 NSMacOSRomanStringEncoding、NSASCIIStringEncoding 但没有运气。 可能是什么问题?

谢谢。



Best Answer-推荐答案


代码\x02 对应于 'fi' 字符串。 'fi' 序列是使用连字绘制的,这就是为什么您只有一个字符代码。
代码和字符串的对应是在字体编码中完成的。字体编码包含一个/Differences 数组,它指定代码\x02 和序列 'fi' 之间的映射

关于ios - CGPDFStringGetBytePtr 在扫描 pdf 时返回不正确的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30118358/






欢迎光临 OGeek|极客世界-中国程序员成长平台 (http://ogeek.cn/) Powered by Discuz! X3.4