新闻中心

数据分析经典案例——智能手机的数据采集和分析(手机数据采集仪器主要采集什么信息)

2023-05-15
浏览次数:
返回列表

背景介绍

用户行为模式识别技术是通过对用户的外在行为进行分析从而得到用户行为模式的过程,在人工智能、模式识别等领域有着广泛的应用前景。传统方式只能识别单人简单的行为模式,且大多只能进行离线识别,不能满足用户行为复杂性和实时性的需求。

早期的研究是可穿戴计算,将传感器穿戴在人体的固定位置进行人的行为手势识别。2004年,MIT的媒体实验室利用人体五个位置携带的加速度计来识别日常生活中的20种常见行为。后来,美国高通公司考虑用户携带手机位置的多样性,融合加速度计、光传感器和多个其余传感器的数据进行人的行为和手机位置识别。

近年来,随着对模式识别理论研究的深入、传感器技术的发展以及智能手机的普及,基于手机运行数据的用户行为模式识别分析技术逐渐走入人们的视野。利用智能手机高度集成化的传感器,如加速度计、陀螺仪、磁力计、压力传感器、GPS等可以采集用户行为模式下多种数据信息。通过手机的定位数据对用户的行为偏好和活动规律进行数据挖掘,对社会软硬件设施建设及周边商家的销售策略提供了有意义的指导意见。判断用户行为模式的核心是模式识别算法,已有的研究使用的算法主要包括K最邻近(K-Nearest Neighbor, KNN)算法,支持向量机(Support Vector Machine, SVM)算法决策树(Decision Trees)算法,隐马尔科夫模型(Hidden Markov Models, HMM)等。

用户行为模式识别

数据采集

移动端数据采集

本文研究主要基于采集手机运行数据并进行分析处理,手机主要使用数据列举如表所示:

手机常用使用数据

传感器的数据采集过程如下所示:

传感器的数据采集过程

采集结果可视化示例:

三轴加速度数据可视化

数据预处理

测量数据在其采集与传输过程中,由于环境干扰或人为因素有可能造成个别数据不切合实际或丢失,这种数据称为异常值。为了恢复数据的客观真实性以便将来得到更好的分析结果,有必要先对原始数据剔除异常值。

另外,无论是人工观测的数据还是由数据采集系统获取的数据,都不可避免叠加上“噪声”干扰,反映在曲线图形上就是一些“毛刺和尖峰”。为了提高数据的质量,去噪声干扰,必须对数据进行平滑处理。

数据预处理步骤

常用的数据预处理方法如下:

常用数据预处理方法

结果分析

用户可能具有运动、学习、饮食、购物等多种行为模式,此处以运动行为模式为例进行分析。

运动行为的定义与指标

运动行为的定义和指标

运动数据分析

在对数据进行分析之前,先对数据进行处理,剔除掉异常值,并对一些缺失数据进行补充,由于采集到的是X、Y、Z三个方向分别的加速度数据,为了增加手机相对人运动方向的鲁棒性,对三个方向的加速度按照公式进行合成,得到了合成加速度。

加速度合成公式

得到合成加速度的趋势图,并分成预备状态和跑步状态两段分析:

运动数据分析

运动行为分析指标

运动行为指标分析

运动行为及频率分析

运动行为及频率分析

运动指标分析

1.运动时间评价

运动时间评价

2.运动频率评价

运动频率评价

3.综合评价

若时间和频率等级相同,则取该等级;若时间和频率等级不同,且只相差一个等级,以频率所在的等级为准;若相差两个等级及以上,将等级高的下降一级作为最终评价。

用户的行为模式分析是一个非常复杂的过程,文章并没有做全面的分析和使用复杂的方法,主要是以运动行为分析为例向大家展示了整个分析的过程,希望以后对大家在实际使用的过程中有一定的启示和抛砖引玉的作用。

搜索