安卓API关联关系知识图谱及挖掘分析

  1. 基于安卓API级别14-29官方文档,逐文档提取包、类、方法、权限四类实体
  2. 针对结构化文本直接解析关系,针对非结构化文本,采用基于模板匹配的关系抽取:人工提取关系匹配模板,逐句进行自然语言处理中的单词主干提取、实体名称规范化等操作,进行关系匹配,获得函数关系、类关系、继承关系、使用参数、返回值、抛出、替代、条件、指代、使用权限等十类关系
  3. 在上述基础上,我们使用TransE算法将实体和关系转化为嵌入向量,并对嵌入向量聚类,提取API之间的相似性,提高恶意软件检测器的性能。

数据与资源

其他信息

价值
最近更新 一月 5, 2023, 13:09 (UTC)
创建的 一月 5, 2023, 13:09 (UTC)