TA的每日心情 | 奋斗 2015-7-30 23:05 |
---|
签到天数: 12 天 [LV.3]偶尔看看II
管理员
- 积分
- 4804
|
- # 读取QQ聊天记录
- qqChat <- readLines("C:/Users/Administrator/Desktop/大数据人社区.txt",encoding='UTF-8')
- head(qqChat)
- # 1.提取除聊天内容以外的信息
- qqInfo <- qqChat[grep("^\\d{4}-\\d{1,2}-\\d{1,2}", qqChat)]
- # 提取时间信息
- time <- substr(qqInfo, regexpr("^\\d{4}-\\d{1,2}-\\d{1,2}", qqInfo), 19)
- # 提取网名和QQ信息
- nameQQ <- substr(qqInfo, 21, nchar(qqInfo))
- # 提取网名信息
- name <- substr(nameQQ, regexpr("^\\D",nameQQ),regexpr("\\(",nameQQ)-1)
- # 提取QQ信息
- QQ <- substr(nameQQ, regexpr("\\(",nameQQ)+1,regexpr("\\)",nameQQ)-1)
- # 时间,网名,QQ,组成数据框
- chat=data.frame(time=time,name=name,QQ=QQ)
- summary(chat)
- which.max(table(chat$name))
- sum(chat$name=="小雄")
- data1 <- as.data.frame(table(chat$name))
- data2 <- data1[order(-data1$Freq),]
- # 2.提取聊天内容信息
- chatContent <- qqChat[grep("^\\D", qqChat)]
- # 聊天内容写入本地文件
- write(chatContent, file = "F:/R/RWorkspace/data/chatContent.txt")
复制代码
搜索
|
|