大数据人|大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

查看: 1058|回复: 1
打印 上一主题 下一主题

[其它] 使用R语言对QQ聊天群里的大水比查找

[复制链接]
  • TA的每日心情
    奋斗
    2015-7-30 23:05
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    852

    主题

    972

    帖子

    4804

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    4804
    QQ
    跳转到指定楼层
    楼主
    发表于 2015-6-13 22:04:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    1. # 读取QQ聊天记录
    2. qqChat <- readLines("C:/Users/Administrator/Desktop/大数据人社区.txt",encoding='UTF-8')
    3. head(qqChat)

    4. # 1.提取除聊天内容以外的信息
    5. qqInfo <- qqChat[grep("^\\d{4}-\\d{1,2}-\\d{1,2}", qqChat)]
    6. # 提取时间信息
    7. time <- substr(qqInfo, regexpr("^\\d{4}-\\d{1,2}-\\d{1,2}", qqInfo), 19)
    8. # 提取网名和QQ信息
    9. nameQQ <- substr(qqInfo, 21, nchar(qqInfo))
    10. # 提取网名信息
    11. name <- substr(nameQQ, regexpr("^\\D",nameQQ),regexpr("\\(",nameQQ)-1)
    12. # 提取QQ信息
    13. QQ   <- substr(nameQQ, regexpr("\\(",nameQQ)+1,regexpr("\\)",nameQQ)-1)
    14. # 时间,网名,QQ,组成数据框
    15. chat=data.frame(time=time,name=name,QQ=QQ)
    16. summary(chat)
    17. which.max(table(chat$name))
    18. sum(chat$name=="小雄")
    19. data1 <- as.data.frame(table(chat$name))
    20. data2 <- data1[order(-data1$Freq),]


    21. # 2.提取聊天内容信息
    22. chatContent <- qqChat[grep("^\\D", qqChat)]
    23. # 聊天内容写入本地文件
    24. write(chatContent, file = "F:/R/RWorkspace/data/chatContent.txt")
    复制代码

    搜索
    回复

    使用道具 举报

  • TA的每日心情

    1438268747
  • 签到天数: 12 天

    20

    主题

    26

    帖子

    89

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    89
    沙发
    发表于 2015-7-9 11:12:06 | 只看该作者
    要把代码普遍化才行
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册会员

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条


    id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

    QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

    GMT+8, 2024-5-17 13:15 , Processed in 0.273819 second(s), 33 queries .

    Powered by 小雄! X3.2

    © 2014-2020 bigdataer Inc.

    快速回复 返回顶部 返回列表