linuxsir首页 LinuxSir.Org | Linux、BSD、Solaris、Unix | 开源传万世,因有我参与欢迎您!
网站首页 | 设为首页 | 加入收藏
您所在的位置:主页 > Linux基础建设 >

Google AI系统DeepMind高中数学考试不及格

时间:2019-04-16  来源:未知  作者:admin666

Google 旗下 DeepMind 团队让 AI 系统接受一项高中程度的数学测试,结果在 40 道题目中只答对了 14 题,甚至连「1+1+1+1+1+1+1」也算错了。说来难以置信,Google AI 系统能打败人类世界棋王,却无法通过高中程度的数学考试。

(imgsource / pixabay)

上周,Google 旗下 DeepMind 团队公布了一份名为《分析神经模型的数学推理能力》的研究报告。在这项研究中,DeepMind 团队让 AI 系统接受一项涵括算术、几何、概率、测量和微积分的数学测试,考题有 40 题,难度大约是英国高中数学的程度。

结果 DeepMind 虽然在一些题目上表现不错,但是碰上文字、加减乘除符号、函数等组成的问题时,却因看不懂题目而无法作答。最后,在 40 道题目中,这个人工智能系统只答对 14 题,拿到「E」的分数,也就是说 —— 不及格。

其中有一道题目是「1+1+1+1+1+1+1」,连小学生都知道答案是 7,但 DeepMind 却答成了6。

研究人员解释,DeepMind 神经模型最长可以计算出现次数(n) 6 次以下的数值,但如果 n = 7,它就算不出来。当 AI 碰到同一数字出现多次,它会认为输入值是出错的。奇怪的是,碰上更长的加法题目,DeepMind 却算得出来。研究人员承认还找不出很好的解释,但很可能是因为 AI 神经网络不断观察每道问题,从而做出正确的解答。

此外,当研究人员要求 DeepMind 在一长串数字中找出「位值」(place value),它就能答得很好,因为它可以按数字大小排出顺序,也能将小数四舍五入。

研究人员说,人类智慧优于神经模型之处,在于对于事物复合式推论的能力。推论是一种复杂、多面向能力的展现。在解答问题时,人脑动用了多种认知能力,包括将符号分类(如区分数字、加减乘除符号、文字、变量)、规划(如找出正确顺序的函数)、演算、运用工作记忆来储存中间值、还要运用学到的规则或定理等。相反的,以卷积和递归神经网络发展出的 DeepMind 擅长模式比对、机器翻译和强化式学习,但弹性远不及人脑。它们不太能将事物推论到已有经验的环境外,更无法处理刻意乱输入的资讯。

目前 AI 或许当不成数学老师,但也已经相当厉害。DeepMi南国七星彩论坛nd 公司的 AlphaGo 接连打败人类围棋冠军李世乭、柯洁。去年 12 月 DeepMind 的 AlphaZero 又在星海争霸 2(StarCraft II)测试赛中,以 5 比 0 打赢世界顶尖职业玩家。此外,自学画画、创作音乐也都难不倒 AI。

友情链接
  • PostgreSQL辟谣存在任意代码执行漏洞:消息不实
  • Firefox beta开始原生支持Windows 10 ARM64
  • fork()成为负担,需要淘汰
  • Ruby 2.3已结束支持,不再发布版本补丁
  • 优麒麟19.04即将发布,华为、阿里云、重大、360四大境像站鼎力支
  • Fedora提出统一流程,弃用上千Python 2软件包更可控
  • Edge on Linux?微软:会有的,但不是现在
  • Mozilla准备让“合格” Linux用户测试WebRender
  • Chrome不想让HTTPS网站通过HTTP下载文件
  • 2019开发者调查:Python或成赢家,Java最不赚钱?
  • 与Red Hat联手,Fedora要支持ARM笔记本
  • Mozilla宣布即将推出Firefox推荐扩展程序计划
  • 新版Chrome等主流浏览器将不再允许关闭点击跟踪
  • WireGuard 0.0.20190406最新快照发布,提供FreeBSD补丁和其他调
  • KDE Plasma 5.16 与 KDE Frameworks 5.57 每周功能总结
  • GIMP 2.10.10 发布,小功能添加和其他改进
  • 到2019年底,LVFS可能会托管1万多个固件文件
  • Visual Studio 2019 发布,带来Live Share 与 IntelliCode
  • Gitpod
  • 关注2019年最佳职位
  • GNU的GasU获得了对Intel BFloat16的支持
  • SuperTuxKart 0.10 RC1 发布,支持局域网/互联网多人游戏
  • Godot 3.2为其2D引擎获得伪3D支持
  • ConnMan 1.37 发布,作为Linux网络连将近一年的第一次更新
  • GitHub有超过3000个提到Vulkan的项目,D3D12有100~200个
  • Ant Design 3.16.2发布,企业级UI设计语言
  • TIOBE 2019年4月编程语言排行榜:C++重回前三名
  • Linux Kernel 5.1 RC3 发布,看起来很不错
  • 英特尔的IWD Linux无线守护进程继续提升新功能
  • 数据库技术 第485页
  • 改进的Spectre/Meltdown开关最终可能会进入Linux内核
  • 关于 Oracle redo与undo 的认识
  • Zabbix 4.2 发布,现代监控系统
  • Oracle DataGuard 报密码文件错误排查
  • Wine 4.6支持共享Wine
  • Facebook为Goya AI加速器开发Glow编译器后端
  • 体彩11选5走势图
  • 新濠博亚
  • 体彩排列3字谜
  • 德州扑克技巧
  • 中国足球内幕
  • 欧博娱乐
  • pk10改20分钟一期