基于大数据的侦查讯问文本数据挖掘与分析
发布时间:2021-10-18 22:58
随着大数据在侦查领域的广泛应用,公安机关的侦查手段不断更新,获取侦查数据的数量和类型趋于丰富。侦查讯问文本蕴含大量有价值的犯罪数据,但是,由于侦查讯问文本缺乏大数据的支撑和服务,文本制作不够规范,导致民警深度挖掘意识不足,仍停留在简单的查询、检索和统计等基础运用,无法真正发挥侦查讯问文本数据之应有价值与潜在功能。因此,有必要构建一体化的侦查讯问文本数据挖掘系统,充分发挥民警的主体核心作用,对文本进行数据挖掘,深挖余罪,发现隐案、积案,关联串并团伙犯罪,最终实现智能预警和犯罪预测。
【文章来源】:中国人民公安大学学报(社会科学版). 2019,35(06)北大核心
【文章页数】:9 页
【部分图文】:
人物特征挖掘
案件要素是指构成刑事案件基本案情的具有犯罪属性的各种信息。运用人工智能技术中的机器学习方法与人工校对相结合的方式对侦查讯问文本中的案件要素(如“七何”要素中的作案工具、涉案物品以及作案手段等)分别提取后进行挖掘分析,具体挖掘步骤参见图1所示。首先,根据预先训练好的序列标注模型对侦查讯问文本中的案件要素进行词性标注,识别出简要案情中的名词、动词和动名词。例如,表述作案工具和涉案物品的词性是名词,因此须从名词中提取作案工具和涉案物品,并用人工方法对少数案情要素中的作案工具和涉案物品进行分类标注;作案手段则从动词和动名词中抽取,如果是动词和名词的结合组成作案手段,需要人工先进行标注,形成种子词库。
侦查讯问过程中的嫌疑人对案发地址的描述大多偏向口语化,例如,嫌疑人口语回答:“在武昌洪山区民族大道七天酒店旁边。”如果需要充分利用地址信息,就必须要匹配精确地址,对系统中出现的地址制定统一的录入标准,例如规定地址必须标注详细门牌地址,并配有经纬度信息。可以通过正向匹配方法编辑距离以及余弦相似性匹配标准地址,提取经纬度信息。将所有案发地址匹配到统一标准地址后,案件的空间信息就可以在一个可比较的范围内进行分析,参见图2所示。3. 案件人物特征挖掘
【参考文献】:
期刊论文
[1]中国犯罪形势分析与预测(2018—2019)[J]. 靳高风,守佳丽,林晞楠. 中国人民公安大学学报(社会科学版). 2019(03)
[2]论信息技术渗透下的侦查变化与回应[J]. 李双其. 山东警察学院学报. 2019(03)
[3]刑事案件构成要素相关性分析应用研究[J]. 苗林林. 政法学刊. 2017(05)
[4]论公安情报分析与大数据分析的融合[J]. 彭知辉. 情报理论与实践. 2017(10)
[5]“以审判为中心”背景下侦查讯问工作的实践考察与完善[J]. 毛建军. 江苏警官学院学报. 2017(05)
[6]预测警务的理论基础与技术路径研究[J]. 李国军. 湖北警官学院学报. 2016(05)
[7]当前并案侦查存在的误区及改进对策[J]. 郭欣. 湖北警官学院学报. 2015(11)
[8]侦查讯问中的大数据解读与应用设想[J]. 殷明. 中国刑警学院学报. 2015(03)
[9]大数据与侦查模式变革研究[J]. 何军. 中国人民公安大学学报(社会科学版). 2015(01)
[10]大数据分析与情报分析关系辨析[J]. 李广建,化柏林. 中国图书馆学报. 2014(05)
本文编号:3443662
【文章来源】:中国人民公安大学学报(社会科学版). 2019,35(06)北大核心
【文章页数】:9 页
【部分图文】:
人物特征挖掘
案件要素是指构成刑事案件基本案情的具有犯罪属性的各种信息。运用人工智能技术中的机器学习方法与人工校对相结合的方式对侦查讯问文本中的案件要素(如“七何”要素中的作案工具、涉案物品以及作案手段等)分别提取后进行挖掘分析,具体挖掘步骤参见图1所示。首先,根据预先训练好的序列标注模型对侦查讯问文本中的案件要素进行词性标注,识别出简要案情中的名词、动词和动名词。例如,表述作案工具和涉案物品的词性是名词,因此须从名词中提取作案工具和涉案物品,并用人工方法对少数案情要素中的作案工具和涉案物品进行分类标注;作案手段则从动词和动名词中抽取,如果是动词和名词的结合组成作案手段,需要人工先进行标注,形成种子词库。
侦查讯问过程中的嫌疑人对案发地址的描述大多偏向口语化,例如,嫌疑人口语回答:“在武昌洪山区民族大道七天酒店旁边。”如果需要充分利用地址信息,就必须要匹配精确地址,对系统中出现的地址制定统一的录入标准,例如规定地址必须标注详细门牌地址,并配有经纬度信息。可以通过正向匹配方法编辑距离以及余弦相似性匹配标准地址,提取经纬度信息。将所有案发地址匹配到统一标准地址后,案件的空间信息就可以在一个可比较的范围内进行分析,参见图2所示。3. 案件人物特征挖掘
【参考文献】:
期刊论文
[1]中国犯罪形势分析与预测(2018—2019)[J]. 靳高风,守佳丽,林晞楠. 中国人民公安大学学报(社会科学版). 2019(03)
[2]论信息技术渗透下的侦查变化与回应[J]. 李双其. 山东警察学院学报. 2019(03)
[3]刑事案件构成要素相关性分析应用研究[J]. 苗林林. 政法学刊. 2017(05)
[4]论公安情报分析与大数据分析的融合[J]. 彭知辉. 情报理论与实践. 2017(10)
[5]“以审判为中心”背景下侦查讯问工作的实践考察与完善[J]. 毛建军. 江苏警官学院学报. 2017(05)
[6]预测警务的理论基础与技术路径研究[J]. 李国军. 湖北警官学院学报. 2016(05)
[7]当前并案侦查存在的误区及改进对策[J]. 郭欣. 湖北警官学院学报. 2015(11)
[8]侦查讯问中的大数据解读与应用设想[J]. 殷明. 中国刑警学院学报. 2015(03)
[9]大数据与侦查模式变革研究[J]. 何军. 中国人民公安大学学报(社会科学版). 2015(01)
[10]大数据分析与情报分析关系辨析[J]. 李广建,化柏林. 中国图书馆学报. 2014(05)
本文编号:3443662
本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/3443662.html