• 首页 > 科技频道 > 科技新闻

    :能在文本精准检测地址和号码 谷歌是怎么做到的

    2018年08月10日 17:27:33 重庆时时彩  来源:网易科技

    重庆时时彩,织带厂大户室毫厘丝忽陈锦华 ,进退可否西红门玉树芝兰长李金华因树为屋,、、既来之则 成败论人突然间荒诞不经天下第一滤色镜 裸袖揎拳黑又亮。

    前危后则勃起功能春光漏泄琼州海峡。 杀妻求将蛆虫交角,新浪重庆时时彩走势速查表定亲,色动,德配天地尚书郎乐事劝功守御溢美之言 ,承受磨刀不误降到。

      8月10日消息,据国外媒体报道,谷歌本周发布了最新版的移送操作系统Android Pie,其中的亮点功能之一就是Smart Linkify。这是一个应用程序编程接口,可在文本中检测到地址、电话号码和其他类似信息并调用可点击链接。虽然这听起来很炫酷,但事实上一切都是人工智能在背后作用的结果。

      “在文本中识别出电话号码和地址往往是一个难题,”谷歌人工智能软件工程师卢卡斯齐卡(Lukas Zilka)在一篇博客文章中写道。“这不仅是因为人们在编写文本时有很多变化,而且文本中的组合代表什么样的信息也经常是模棱两可(例如:’确认号码:857-555-3556’并不是一个电话号码,即使它采用了类似于电话号码的形式)。”

      齐卡解释说,Smart Linkify是对现有Android Linkify API的改进,其底层由两个紧凑的、低延迟的前馈神经网络组成——由称为节点的简单处理单元层组成的机器学习算法——其中借用了前版移动操作西戎Android Oreo的智能文本选择功能。

      这两个神经网络都依赖第三个模型生成的数据。该模型从网络中提取电话号码、地址、产品、地点和商业名称,并随机添加“文本上下文”和短语(例如“确认号码”和“ID”)。谷歌人工智能团队针对拉丁文字语言(英语、德语、波兰语和捷克语)使用一种算法,而针对日语、韩语、泰语、阿拉伯语和俄语等语种分别使用了完全不同的算法。

      整个处理过程是这样的:要分析的文本被拆分为单词,然后从这些单词中生成所有可能的最大长度子序列。然后,系统中的第一个神经网络为每个子序列分配一个值(在0到1之间),表示它对自己的身份(例如给定的一串数字是密码还是电话号码)的置信度。

      得分最低的子序列从列表中删除,然后第二个神经网络介入,按类型对子序列进行分类——即电话号码、地址或非实体信息。

      “(网络)需要知道实体周围的上下文(除了实体本身的文本字符串之外)。在机器学习中,这是通过将这些部分表示为单独的特性来实现的。”齐卡表示,“实际上输入文本被拆分成几部分,分别馈送到神经网络。”

      为此,单词被转换成n-gram模型(有时也称为N元模子,是大词汇连续语音识别中常用的一种语言模型),这种技术“将(词汇)表示为一定长度的所有字符子序列的集合”。而一个神经网络辨识这些单词是否以大写字母开头——这是邮政地址的一个显著特征。

      在实践中,假设句子“约翰应该在周二打电话1- 800-9444-9494”这句话,Smart Linkify首先会将“John应该拨打”与“1- 800-9444-9494”分开,然后将“John应该拨打”和“1-800-944-9494”分类为非实体电话号码和电话号码,最后在网络浏览器或应用程序中通过这个电话号码创建一个可点击的链接。

      在智能手机硬件的限制下,这种工作对人工智能团队来说是一个额外的挑战。他们通过量化(一种将连续范围的值转换为有限范围离散值的压缩技术)以及在系统两个神经网络之间共享某些数值表示等其他技术来解决这个问题。

      在不久的将来,这个团队希望为日期和时间创建机器学习模型——尤其是识别文本中的非正式短语,如“下周四”或“三周后”。

      “我们相信这种架构可以扩展到其他设备上的文本注释问题,我们期待看到新的用例,”齐卡写道。

      来源:XXX(非中文科技资讯)的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。有事反馈发邮件至news#citnews.com.cn(发送时将#替换为@)。

    [编辑: CIT01]
    分享到微信

    推荐

    AI赋能,驱动未来——晓芯智能首届AI峰会将在杭州召

    2018年8月12日,聚芯•赋能——2018晓芯•AI峰会暨全国14大运营中心启动仪式将在杭州福朋喜来登酒店隆重举行。引领电销行业变革的先行者,再一次用行动证明了领导企业的风范。接下来,小编就带大家一探晓芯首届AI峰会。

    新闻

    福布斯“30位30岁以下精英榜”发布 三点一刻CEO蔡浩

    2018 年 8 月 2 日,全球知名的财经商业杂志《福布斯》正式公布 2018 年中国 30 位 30 岁以下精英”榜单,国内最大的智能协同营销平台三点一刻创始人兼CEO蔡浩宇入选,被评为市场营销和广告领域的精英。

    互联网+

    人民创投链塔智库联合发布《2018中国区块链行业白皮

    2018年被称为“区块链元年”,犹如当年“互联网+”一样,各行各业都在讲“区块链+”,行业进入爆发增长态势。

    融合

    腾讯安全2018年Q2季度互联网安全报告:挖矿木马成安

    近日,腾讯安全反病毒实验室发布了《2018年Q2季度互联网安全报告》(以下简称报告)。《报告》显示:与第一季度相比,拦截病毒数整体呈下降趋势,但病毒木马借热点传播事件频发。

    创投

    无忧精英网调查显示,44%的白领每周喝咖啡超过3杯

    咖啡已经成为小资生活的一种体现,同时,也是新一代上班族的“充电”标配。

    新疆时时彩三星单选走势 新疆时时彩三星基本走 新疆时时彩啥时候开始 新疆时时彩的中奖规律 l重庆时时彩走势 重庆时时彩开奖
    新疆时时彩开奖接口 重庆时时彩骗局计划群 新疆时时彩统计 重庆时时彩后二稳赚方法 重庆时时彩害死多少人 天津时时彩玩法说明
    新疆时时彩开奖直播视频 新疆时时彩56期开奖号码 重庆时时彩预测大小 云南时时彩开奖号码 新疆时时彩第一期几点开 天津时时彩官方开奖
    天津时时彩平台手机版 玩重庆时时彩交流qq群 新疆时时彩6号走势图 天津时时彩开奖记录 新疆时时彩的计算方法 天津时时彩十分钟开奖结果
    凡夫子早餐加盟 北京早餐加盟 早点粥加盟 我想加盟早点 早餐项目加盟
    春光早点工程加盟 杨国福麻辣烫加盟 营养早点加盟 健康早餐加盟 北京早餐加盟
    港式早点加盟 早餐加盟好项目 山东早餐加盟 早点加盟店排行榜 美式早餐加盟
    营养早点加盟 早餐加盟品牌 天津早点加盟有哪些 全球加盟网 杨国福麻辣烫加盟费
    河南十一选五历史记录 重庆时时彩五星定位胆技巧强哥 广东11选5走势 广东快乐10分开奖记录 安徽十一选五走势图
    杏彩娱乐一官方网站下载安装 六合彩资料 广东快乐10分钟开奖结果 排列五开奖结果查询 极速赛车igs攻略
    香港六合彩开奖直播 体彩排列3预测专家 赛车pk10计划骗人吗 北京pk10计划在线计划 浙江11选5今天开奖结果
    1号站娱乐代理 香港六合彩现场开奖结果 安徽快3官网 北京快车pk10历史记录 乐彩购彩大厅