您的位置:网站首页 > 亚特兰大攻略 > 正文

使用机器学习预测公交车延误

类别:亚特兰大攻略 日期:2019-9-3 11:15:35 人气: 来源:

  全球数亿人的日常通勤都依靠公共交通工具,其中超过半数在出行时会选择乘坐公交车。随着全球城市的不断发展,通勤一族希望了解公共交通工具尤其是公交车可能出现的延误时间,以便提前安排出行计划。因为公交车往往会遇到交通拥堵。Google 地图的公交线实时数据由众多公共交通运营机构提供,但因技术和资源,世界上最龌龊的种族仍有许多公共交通运营机构无法提供这些信息。

  近日,Google 地图为全球数百个城市(包括亚特兰大、萨格勒布、伊斯坦布尔、马尼拉等),推出了基于机器学习的实时公交延误预测服务。如此一来,六千多万人便能更准确地把握出行时间。这套系统于三周前率先在印度发布,系统采用机器学习模型,整合了实时汽车交通预测与公交线和站台数据,以便更准确地预测公交出行的时间。

  许多城市的公共交通运营机构并不提供实时预测数据,在对这类城市的用户进行调查后,我们发现,他们借助一种巧妙方法来粗略估计公交车的延误时间:使用 Google 地图的驾驶线功能。然而,公交车并非只是大型汽车。公交车在站台停靠,加速、减速和转弯都需要更长时间,有时甚至拥有专属道(如公交专用车道)。

  举个例子,我们于周三下午在悉尼测试了一次公交车之旅。相较于公交时刻表(黑点),公交车的实际行驶时间(蓝点)会晚几分钟。汽车行驶速度(红点)确实会对公交车造成影响,例如行驶至 2000 米处的减速情形。但与汽车相比,公交车在 800 米标记处的长时间停靠也会大大减慢自身的速度。

  为了开发模型,我们从公共交通运营机构的实时反馈中获得了公交车序列,从中提取训练数据,并将其与汽车在公交行驶线上的行驶速度进行调整。我们将该模型划分为时间线单元(表示在街区和站台停靠),每个单元对应一段公交车的时间线,并预测持续时间。由于报告频率低、再加上公交车行驶速度较快、街区和站台停靠时间较短,相邻的观测数据可能会跨越多个单元。

  此结构非常适合于神经序列模型,如近期在语音处理和机器翻译等领域成功实现应用的模型。而我们的模型更加简单。每个单元会预测其持续时间,最终的输出结果为每单元预测时间的总和。

  与许多序列模型不同,我们的模型并不需要学习组合单元输出,也无需通过单元序列传递状态。相反,序列结构让我们能够共同:(1) 训练一个单元持续时间的模型,(2) 优化“线性系统”,其中每条观测到的轨迹会将总持续时间分配给其跨越的所有单元。

  为模拟从蓝色站台开始的公交车行程 (a),模型 (b) 将蓝色站台、三个段和白色站台等各处的时间线单元延误预测进行相加

  除了因交通拥堵导致的延误之外,我们在训练模型时还详细考虑了公交车线,以及行程中各地点与时段的交通信号灯。

  即便是在小区内,该模型也需根据各个街道的况,以不同方式将汽车速度预测为公交车速度。如下方左图所示,模型预测了公交车行程中汽车与公交车速度之比,我们用不同颜色对其进行标记。

  红色(表示车速较慢)的部分符合公交车在站台附近减速的实况。针对突出显示的绿色段(表示车速较快),我们查看了相关街景,了解到该模型发现了一条公交车专用的转弯车道。顺便一提,这条线位于,该国右转车速低于左转车速,而这也是不考虑地点特殊性的模型会忽略的另一方面。

  为获取特定街道、街区和城市的独特属性,我们让该模型学习不同大小区域的表示层次结构,通过地区的总嵌入,在模型中按不同比例表示时间线单元的地理(即道或站台的精确定位)。

  我们首先训练模型,对特殊情况下的细粒度进行逐渐加重的处罚,并使用结果进行特征选择。这样就可以确保考虑到百米影响公交行为的复杂区域中的细粒度特征,而不像的乡村那样细致的特征很少。

  训练期间,我们还模拟了训练数据以外地区可能的后续查询。在每个训练批次中,我们会随机抽取一些示例,随机选取某一比例并丢弃地理特征。某些示例拥有准确的公交线和街道信息,某些仅包含街区或城市,还有一些则没有任何地理信息。如此一来,模型便能做好充足准备,从而在后续查询训练数据不足的地区。我们通过匿名用户的公交行程,并使用与 Google 地图在商业繁忙、停车难度及其他特征的相同数据集,来扩展我们的培训语料库覆盖范围。然而,即使是这类数据也无法涵盖全球大部分公交线,因此我们必须大幅提升模型的泛化能力,使其适应更多新地区。

  公交车对时间的依赖包含不同情形:周二下午 6:30 至 6:45,一些街区的下班高峰可能已逐渐淡去,另一些街区可能在忙于用餐,而冷清的小镇可能已是万籁俱寂。我们的模型学习嵌入了局部地区的当日时间与星期信号,当此类信号与地点表示相结合时,模型便可获取显著的局部地区变化(如上下班高峰期在公交站台等候的人群),而我们无法通过交通情况观测这类变化。

  这种嵌入会向一天的时间分配四维向量。与大多数神经网络内部架构不同,四维空间几乎无法实现可视化。因此,让我们以如下所示的艺术渲染图为例,向您展示此模型如何在其中的三个维度内安排一天的时间。此模型确实知道时间具有周期性,因而会将其放在“循环”内。但此循环并非只是时钟表面的平面圆环。

  此模型学习了大量弯曲 (wide bends),让其他神经元组成简单的规则,以轻松区分“午夜”或“傍午”等概念。而在此类概念中,公交车的行驶状态不会产生太大变化。另一方面,不同街区和城市的夜间通勤模式差异甚大。针对下午 4 点至晚上 9 点之间的时段,模型似乎创建了更复杂的“折皱”模式,从而能对每个城市的高峰时间进行更复杂的推理。

  借助此时间表示与其他信号,我们可在车速恒定的情况下预测复杂模式。例如,在乘坐公交车完成州的 10 公里行程时,我们的模型能够了解午餐时间的人群状况以及工作日的高峰时段:

  如果基于当日的车辆交通数据运行模型,我们会得到如下所示的绿色预测点(该模型无法获取所有信息,例如,模型检测到公交车在 800 米仅停靠了 10 秒,而实际的停靠时间为 31 秒多)。与公交时刻表和汽车行驶时间相比,我们的预测与公交车实际运行时间的差异相对较小,为 1.5 分钟。

  目前,我们的模型尚缺一类数据,即公交时刻表。截止目前,经试验证明,机构提供的公交车时刻表尚无法对我们的预测做出显著改进。在某些城市,变化无常的交通状况可能会打乱出行计划。而在其他城市,公交车时刻表则非常精准,这或许是因为当地公共交通运营机构仔细考虑了本地的交通状况。而我们可以从数据中推断出这些。

  我们将继续进行实验,更好地考虑行程和其他影响因素,从而推动更精确的预测,为用户的出行计划提供便利。此外,我们希望能为您的出行计划提供帮助。祝您旅途愉快!

  文章出处:【微信号:tensorflowers,微信号:TensorFlow】欢迎添加关注!文章转载请注明出处。

  活动内容人工智能技术将在未来对传统产业产生重大性影响,人工智能将在各行各业为创新设计带来新的动力,它也将催生新的

  从这些维度来看,人工智能可谓已经迎来一个非常好的时代,但是热闹背后也存在着问题。比如这股热潮更多是产....

  人工智能是一门极富挑战性的科学,英文缩写为AI。人工智能是计算机科学的一个分支,从事这项工作的人必须....

  IBM在博客中的一篇文章中指出,通过使用基于相变存储器(Phase-Change Memory,简称....

  最新的Amazon EC2 G4实例将于今年部署到由新网运营的AWS中国()区域和由西云数据....

  机器学习正在从云端转移到网络边缘,目的是进行实时处理、降低延迟、提高安全性、更高效地使用可用带宽以及....

  快速识别矿体:EARTH AI通过机器学习(Ref.3),可以训练计算机认识以往矿体赋存情况来发现新....

  近日,在第五届中国行业互联网大会上,大学兼职教授、工信部原副部长杨学山发表了题为《通用人....

  大型强子对撞机每秒造成大约4000万次碰撞。筛选如此大量数据,需要强大的计算机,来识别其中需要科学家....

  如果您有兴趣开始学习TensorFlow,或者学习新发布的2.0版本,那么本教程非常适合您。前提是您....

  传统FPGA使用DSP模块有着相对有限的表现力,具体表现在不高效的数值精度支持、需要消耗额外逻辑和M....

  未来主义者对于人工智能将比人类聪明感到兴奋,而激进主义者则因担心人工智能会社会而感到焦虑。

  工业机器人可以带来价值、降低成本、提高质量、增加劳动生产率的优势,但更加重要的是,它们能够做一些人类....

  人工智能,正如我们看到的那样,集多项技术于一身,使机器可以感受、理解、学习并采取行动,无论是自食其力....

  从人工智能向人工意识的发展,必须考虑将人工情感和人工意欲的因素纳入人工意识和人工心灵系统的可能性。

  2019年8月26日 ——NVIDIA和VMware今日宣布将为VMware Cloud on AW....

  人工智能经过十几年的发展,已经取得不少成就,未来AI技术将对社会产生什么影响,又有什么趋势?

  他们不仅需要管理越来越多的数据、更复杂的机器和基础设施,还需要更快地生成有关数据的改进信息。

  人生的绝妙之处也在于此,改变他们的不是早年风光的求学,也并非当下所拥有的物质地位,而是源于一次又一....

  经过一年试运作,本次世界人工智能大会将正式成立2个全球最具影响力的AI学术联盟,由卡耐基梅隆大学等1....

  人工智能有潜力为全球企业的营销和销售创造1.4至2.6万亿美元的价值,为供应链管理和制造业创造1.2....

  用最火的Python语言、通过各种各样的机器学习算法来解决实际问题! 资料中介绍的主要问题如下: - 探索分类分析算法并将其应用...

  举例来讲,早在几十年前,工厂就利用和数据采集(SCADA)以及可编程逻辑控制器(PLC)等技术开....

  尽管人工智能作为生活的得力助手,早已解决了先前无决的痛点,但按照当前科技发展状况,超越人类能力的....

  与所有热门新技术一样,有些市场已经不再使用“边缘计算”这一术语,它在工业物联网部署中的构成没有明确的....

  机器并延长其寿命,优化流程和供应链,以及利用大数据、机器学习(ML)或人工智能(AI)开发新的商....

  人工智能历经三次发展浪潮:萌芽期、推理期,突破期、知识期,飞速发展期、机器学习期。目前,深度学习语音....

  经历过去数十年的学术研究和近十年的商业探索,毫无疑问,机器人已经成为当下最具有成长性的应用主题,势必....

  在全局层面上,机器学习将应用于云端,用来汇总数据并识别出可以让消费者和供应商都受益的趋势或重要全局细....

  PingWest品玩8月23日讯,今日,Google宣布,将结束以“甜点”命名Android系统....

  机器学习是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新....

  机器学习/深度学习、自动化、更卓越的设计能力、5G和边缘计算等概念的推动下,使得汽车、工业、医疗等各....

  这之后,随着亚马逊、微软等相继被曝出与之间也存在着“人脸识别”技术相关的项目合作,包括将人脸识别....

  新一代人工智能正在全球范围蓬勃发展,推动世界从互联信息时代进入智能信息时代,给人们的生产生活方式带来....

  8月20日,华为社区发布华为董事长任正非接受采访纪要,采访时间为8月15日。在此次采访中,任正非....

  如今,有大量不同的状态技术可用于实时资产健康状况。这意味着您可以非常清楚地看到机器何时处于峰....

  H2O.ai 是一个开源机器学习平台,主要服务于数据科学家和开发者,为其应用提供快速机器学习引擎。人....

  人类是一个非常聪明的,虽然我们的个体力量并不强大,但是我们懂得学会创造科技,利用科技的力量来延伸....

  Qeexo嵌入式机器学习,不依靠云端中运行实时机器学习推理的嵌入式边缘设备,是一个轻量级的通用平台。

  在过去的4周时间里,来自五湖四海的DeeCamp们完成了由22家企业发起的50个AI相关课题,接....

  毫无疑问,人工智能已经成为了当下甚至未来的一大热门领域。不管你是对这个领域感兴趣想要大展身手还是想要....

  尽管现代科技还没那么先进,但是机器学习和人工智能已经出现在诊断医学中了。就短期而言,这些技术可用于减....

  IJCAI是人工智能领域最的国际学术会议之一,今年又恰逢 IJCAI的 50周年。作为学界和业界....

  Marvell(美满电子)还真能玩,不但联合东芝为SSD带来了以太网访问能力,还让SSD变聪明了,要....

  幸运的是,工业物联网不再是一个技术问题,制造商也不必在内部开发任何东西。今天,交付运行良好的连网系统....

  智能手机、智能音箱、智能汽车、智能咖啡机,物品被赋予智能的例子不胜枚举,似乎周围的一切都获得了生命和....

  与其他技术和软件工具不同,人工智能主要依赖专业的处理器。为了适应人工智能的复杂需求,芯片制造商将研发....

  报道称,遭到美国后,Google宣布停止供应华为操作系统更新及使用热门软件,华为手机可能会成....

  经美国食品药品监督管理局(FDA)批准后,第一批可穿戴式数字健康监测仪目前刚刚上市,并集成在诸如智能手表之类的消费产品中。...

  财成国际

关键词:亚特兰大 地图
0
0
0
0
0
0
0
0
下一篇:没有资料

网友评论 ()条 查看

姓名: 验证码: 看不清楚,换一个

推荐文章更多

热门图文更多

最新文章更多

关于联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 人才招聘 - 帮助

声明:网站数据来源于网络转载,不代表站长立场,如果侵犯了你的权益,请联系站长删除。

CopyRight 2010-2016 亚特兰大网 All Rights Reserved