• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

android - 如何检测文本是否可读?

[复制链接]
菜鸟教程小白 发表于 2022-12-12 10:15:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题

我想知道是否有办法告诉给定文本是人类可读的。人类可读,我的意思是:它具有某些含义,格式类似于某人撰写的文章,或者至少由旨在供人类阅读的软件翻译器生成。

这是背景故事:最近我正在制作一个允许用户将短文本上传到数据库的应用程序。在部署的早期阶段,我注意到由于编码问题,一些用户总是上传损坏的文本。这个问题稍后会解决,但让我想知道是否有办法在将文本提供给用户之前提取非人类可读的文本。

任何建议将不胜感激。范围可能太大而无法包含其他语言,所以目前让我们将讨论限制在英语范围内。



Best Answer-推荐答案


您可以尝试语言识别工具或类似的工具。

基本上,您必须计算字符或字符组(字符 n-gram),并将提交的文本的字母分布与以良好英语编写的文本集合的字母分布进行比较。 (确保这样的文本集合代表预期的输入)。

在 N-gram 方法的连续性中,您可能想尝试基于字典的方法并检查是否存在“停用词”(例如“the”、“a”、“an”、“of”)输入文本。

关于android - 如何检测文本是否可读?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24007912/

回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注0

粉丝2

帖子830918

发布主题
阅读排行 更多
广告位

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap