英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
以交互为中心的数据集,用于学习智能家居中的自动化规则
凯·弗雷德里克·恩格尔曼,帕特里克·霍尔豪斯,布里塔·雷德(Britta Wrede),塞巴斯蒂安·雷德
德国比勒费尔德大学卓越认知互动技术(CITEC)小组 德国比勒费尔德大学认知与机器人研究所(CoR-Lab)
摘要
术语“智能家居”指的是一种生活环境,通过其连接的传感器和执行器,可以为用户提供智能和情境化的支持。这可能会导致自动行为融入用户的日常生活。但是,当前大多数智能家居都不提供这种智能支持。迈向此类智能功能的第一步在于通过观察用户的行为来学习自动化规则。我们提出了一种新型语料库,用于从用户行为中学习此类规则,这些行为是从智能家居传感器和执行器网络中的事件观察到的。数据包含有关用户预期任务的信息以及来自该网络的同步事件。它来自59个用户与智能家居的交互,以解决五个任务。语料库包含40多种不同类型数据流的记录,并且经过分段和预处理以提高信号质量。总的来说,该数据显示特定数据类型上的高噪声级别,可以通过简单的平滑方法将其过滤掉。所得数据可洞察由任务特定的用户行为产生的事件模式,从而构成机器学习方法学习自动化规则的基础。
关键字:行为语料库,智能家居,物联网,环境智能
- 介绍
在最近的文献综述中,Mennicken等人。 (2014年)考察了实现智能家居概念的当前科学尝试。他们将环境与用户的协作(或共享自主权)命名为该领域中充满希望的挑战之一。因此,建议使用一种向用户建议自动行为的系统作为实现令人满意的家庭自动化程序的可能解决方案。因此,智能环境必须能够提供用户根据自己的行为提供一组功能。乌雷特(Uret al) (2014)因此在一项研究中揭示,在60%以上的案例中,可以基于简单的触发动作规则来启用功能。为了计算这类规则,许多现有方法都采用了学习用户行为的技术。 Aztiria等。 (2008年),例如,将机器学习技术与允许对环境进行语言编程的语音识别系统相结合。然而,这样的系统仍然需要手动确认或调整以控制诸如卷帘门或照明系统的控制装置。只有少数方法,例如MavHome(Cook等人,2003年),可以跳过编程例程,而是学习无人监督的规则。在智能房间中,会观察到居民,系统会尝试预测用户的行为。我们还声称学习某些规则是可行的,例如如果窗户是打开的,则可以降低温度,这完全来自观察用户行为。然后可以将这些规则组合到旨在支持智能家居中居民的系统中,例如通过建议预设给用户的某些配置。与现有的家庭自动化技术相比,与在特定时间例如记住单个设备的状态相比,这种系统能够推断出更通用的规则。在六点钟打开咖啡机。取而代之的是,它提供了将多个设备与用户偏好相关联的功能。为了获得此类优先规则,需要创建导致给定首选配置的用户操作数据集。然后可以使用这样的数据集来训练学习适当关系的算法。与其他机器学习领域不同,例如语音理解或面部检测据我们所知,没有可供公众使用的适当数据集。因此,我们提出了一种新的语料库,该语料库被明确设计为适合从用户行为中学习环境配置的需求。本文中,我们将更详细地描述获得的语料库的特征和程度。第2节记录原始数据的实验设置。第3节提供了有关语料库内容的更多信息。第4节介绍了由分段和转换步骤组成的初步分析。本节还通过比较成功段和未成功段来提供对第一个发现的见解。然后在第5节中进行简要讨论,并在第6节中进行总结,并进行简短总结。
- 实验配置
为了从现实情况中可以找到的情况中获取合理的数据,提出的语料库已记录在认知服务机器人公寓(CSRA)1中。 这种智能环境包括一个功能齐全的厨房,客厅和浴室,配备了一系列标准家具(请参见图1)。 除了恒温器或运动传感器之类的标准家庭自动化硬件之外,公寓中还安装了更复杂的设备,例如麦克风,相机,甚至是移动机器人。 因此,CSRA有资格作为记录此数据集的理想环境,因为它(a)为用户提供了多种操作机会,并且(b)允许获取有关执行这些操作的详细信息。
图1:认知服务机器人学公寓的概览图。在前台,一位研究参与者正在打开客厅的一个窗户。在后台,有走廊和厨房区。在我们的移动机器人前面的中央墙上,有用于控制温度和无线电的控制面板。
2.1参与者
总共有59位受试者参加了研究并成功记录。他们全部填写了调查表。年龄在18至64岁之间的男性参与者为30位,女性为29位。其中54%(32位参与者)的年龄在22至27岁之间。近三分之二(63%,即37位参与者) 的参与者表示,他们在智能家居环境或可编程设备。
2.2建议
调查人员和参与者一起进入了公寓。 简短介绍后,研究人员将任务列表交给参与者,然后离开房间。我们请他们自己解决每个任务。 大多数参与者完全按照我们的指示进行操作,即他们按照给定的顺序完成了任务(40次运行,占66%)。 尽管如此,很大一部分(任务5最多运行21个任务,占36%)与实验脚本有很大出入,导致结构化的数据更加复杂(请参见下文第4.3节)。给参与者的任务是:
1.通过调节恒温器并打开窗户为房间通风。
2.在厨房里使用电热水壶,边听收音机边喝茶。
3.关闭窗口,然后将温度调回室温。
4.在客厅放松。 关闭收音机后,选择合适的灯光设置并看电视。
5.关闭所有设备并调节温度后,离开房间。
打开厨房的灯,或者关闭不符合他们喜好的收音机。任务4是最复杂的任务。 虽然目标温度只是一个值,但选择照明设置取决于房间中每个灯的四个变量(电源状态,色相,饱和度,值)。
2.3问卷调查
每个参与者离开公寓后,他们都要填写问卷。 他们的结果表明,有54位参与者(92%)希望自己的家中至少有一些支持性自动化。 但是,绝大多数(46,相当于78%)希望保持控制,并且希望每个自动化过程(无一例外)都可以取消。 这表明对于智能环境中的居民而言,迫切需要控制,这需要透明且易于管理的界面。
- 语料库内容
对于数据采集,我们基本上使用与Holthaus等人相同的设置。 (2016),我e。公寓内的所有设备都通过相同的中间件进行通信(Wienke和Wrede,2011)。从而将用户动作(例如,电灯开关的操纵)和感官输入(例如,当前温度)连同它们的时间注释一起记录到硬盘上(Moringen等人,2013)。结果,我们的语料库提供了有关所有用户触发的事件以及公寓内部的最终配置的及时同步信息,这是了解它们之间的时间和因果关系的前提。生成的文件可在JSON2或XML3格式之间转换。
此外,还记录了来自四个不同角度的视频以供进一步评估。但是,请注意,由于隐私问题,音频和视频不属于语料库。只有匿名的感官数据和系统事件将公开可用。该数据集涵盖了来自所有59位人员的25万多个事件,这些事件解决了我们周围居住公寓中的五项不同任务。一次运行中最多有9190个事件。每次运行持续12分钟平均。总体上,语料库中有40多种不同类型的事件,其中表1给出了一些最突出的例子。
表1中的数据类型可以更详细地描述如下。窗户把手传感器提供有关客厅中两个窗户的当前状态的信息。它可以采用打开,倾斜和关闭的值。总共有三个不同的值表达式和两个不同的流。状态一旦改变,流即发布。 e。使用者可以改变手柄的角度。簧片开关传感器为客厅中的两个窗户,厨房中的两个橱柜以及公寓的所有四个门提供打开或关闭状态。
当前温度是使用公寓中央的单个传感器测量的,可用摄氏度表示,小数点后一位。 此外,可以在机器人前面的控制台上设置所需的温度
表1:数据集中事件的示例性摘录。 对于每种类型,给出了可能的表达式的数量以及流(数据源)的数量。
(请参见图1)。如果两个事件中的任何一个发生更改,则将发布一个事件。用户修改目标温度时,每次更改0.1度都需要单击一次按钮。因此,校正两个度会导致总共20个事件。
另一个传感器可提供有关我们公寓中27个电源插座的当前功耗(瓦)的整数信息。在前17次试验中,仅当值变化至少23瓦时才会发生事件。在这些参与者之后,我们改变了功耗传感器的分辨率,因为我们意识到初始分辨率太低,以至于无法感知例如需要5瓦功率的灯的激活。在其余部分中,分辨率设置为一瓦,这样我们就可以记录这些变化。
同样在中央控制台上,用户可以按按钮以打开收音机(请参阅任务2)。因此,数据集包含无线电当前正在播放还是静音的信息。在公寓中,有38个灯泡可以配置为首选颜色。所有配置更改都可以作为数据集中的事件使用,即e。当前颜色由色相,饱和度和值(HSV颜色空间)的三个整数给出。此外,电源状态为开或关,因为用户也可能会打开灯。通过公寓的16个运动传感器可以粗略估计用户的位置。对于它们中的每一个,如果状态从无动作变为某动作或反之则触发一个事件。
- 数据分析
本节概述了语料库的第一次分析。我们描述了数据的一些特征,并表明该语料库是探索行为数据之间关系的有用工具。
-
- 分节
我们调查了59个跑步,并根据五个给定任务对所有数据进行了细分,结果是59个参与者乘以5个任务= 295个细分。 这是基于对视频数据的手动注释。 我们尝试将组成部分的片段和每个任务的主要事件的影响降到最低。 我们正在寻找可以看到参与者阅读其指导文件的时刻。 事实证明,我们在视频中看到的某些电灯开关和处理传感器事件未包含在数据中。 为了更好地了解数据,我们决定最初只考虑表2中列出的七个事件以进行精确分析。 这些流是强大的发布者,在我们的研究中没有数据丢失。图2显示了每个任务分段持续时间的箱形图。 与任务1相比,人们可以认识到任务3的改进。此外,任务4是平均值最高的任务,因为我们不要求他们看电视的特定时间。
图2:所有五个任务持续时间的箱形图。 对于每个任务,中位数以红线给出。 所有持续时间的50%都包含在框中,所有其他数据(异常值除外)均由黑色水平横线限制。
表2:用于我们的数据分析的选定流。 对于每个流,列出了相关任务,并给出了是否包含二进制数据。
4.2从事件空间到状态空间的转变
如表2所示,某些事件没有二进制数据,大多数事件只是按需发布(作为一个轻量级开关)。但是了解每个设备的当前状态(打开/关闭或打开/关闭)对确定整体环境配置很重要。智能环境可以打开窗户或打开电视,但无法校正手柄角度或功耗。因此,主要步骤是将这些事件流量化为二进制状态。
图3:单个用户示例性执行任务4的数据的可视化。 在大约20秒时,收音机从打开(红色框,底部)切换为关闭。 30秒后,电视将打开(紫色框,顶部),这可以从相应电源插座的功耗(蓝线)中扣除。
两种类型需要不同的策略才能转换为状态空间。单选按钮(打开/关闭)和簧片开关(打开/关闭)的二进制事件被视为从一种状态到另一种状态的转换。更复杂的是诸如功耗变化之类的过程转换。在自动调节其温度的冰箱等许多电器中,不断发生着细微的变化。实施较低的阈值后,事件数量迅速增加。因此,不可能将每个上升和下降都解释为不同的状态。而且,只有在打开设备电源后才会出现一些流。为了找到适当的变换,我们分析了所有功耗传感器的基准线,并从无人居住的公寓的一分钟记录中计算出平均值和标准偏差。如果电流消耗高于其平均值 标准偏差基准线,则我们将电源状态解释为“开”。对于温度,我们将基线设置为19摄氏度。低于18.5摄氏度的温度被解释为凉爽状态。
状态的可视化示例可以在任务3的图3和任务5的图4中看到。
图4的前三分之一显示了电视当前功耗的图表。 我们将电源状态分类为“开”的区域显示为紫色。 对于目标温度配置,第二个三分之一执行相同的操作。 我们将区域假定为凉爽的状态涂成蓝色。 对于此分类,仅会发布新的当前温度的事件将被忽略。 最底部的三分之一显示出入口门的状态。 数据中是已安装的簧片开关的事件,指示打开或关闭的动作。 彩色区域是门打开的时间。
4.3完整和不完整的细分
对事件数据的首次分析显示,某些段未包含我们认为相关的所有流(如表2所示)。这些不是技术错误,而是由不同的用户行为引起的,即用户忘记执行子任务。由于可以将其解释为“错误”数据,因此我们将标签“完成”分配给包含所有预期流中所有数据的所有段,将“不完整”分配给缺少一个或多个预期流的所有段。因此,“完整”片段内的变异可被视为需要由学习模型捕获的自然发生的变异。通常,这些变化与序列中的小变化有关,例如在用户去厨房之前(或之后)打开收音机。不完整的部分包含来自任务执行的数据,其中参与者跳过了一些任务,离开了房间以寻求帮助或试图以一种不常见的方式解决任务(例如,启动电视以打开收音机)。因此,在这类数据中,存在其他交互作用和事件,而没有相应的任务。表3显示了不同任务的多少段分为完整与不完整。
图4:单个用户对任务5的示例性执行的数据的可视化。 关闭电视(紫色框,顶部)后,参与者降低所需的公寓温度(蓝色框,中央)。 大约50秒后,前门被打开(绿色框,底部)。
分类对于识别数据中的某些特征很有用。 图5以与图4相同的样式显示了任务5的所有59个部分。在我们分类为完成的38个任务的所有部分中,环境在进入时处于“电视关闭”和“温度冷却”状态。 门开了。 缺少电视或温度事件可以识别出21个分类为不完整的运行。 这可能是自动化规则
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[409625],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。