大数据人官方②群

大数据人|中国大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

查看: 1032|回复: 0

[上海] 上海simplyBrand信励科技招数据采集

[复制链接]
  • TA的每日心情
    奋斗
    2015-7-30 23:05
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    849

    主题

    969

    帖子

    4779

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    4779
    QQ
    发表于 2016-5-12 13:07:04 | 显示全部楼层 |阅读模式
    职位描述:
    Job Description:
    1. 负责制定网络数据抓取规则,数据的提取、清洗、入库以及汇总的开发工作;
    2. 负责传统网页、电商网站、社会化媒体网站等互联网数据的高效采集与正确解析;
    3. 负责搜索爬虫的核心技术研究与开发,搜索前沿爬虫技术并实践;
    4. 大规模分布式互联网爬虫系统的开发和维护,提升网页抓取效率和质量。
    Requirements (任职要求):
    1. 本科或以上学历,计算机及相关专业,1年以上开发经验, 熟悉HTTP传输协议;
    2. 熟悉搜索引擎和网络爬虫相关技术,有网页采集、Hbase等相关开发经验者优先,从结构化的和非结构化的数据中获取信息;
    3. 熟悉Hadoop/Lucene/Nutch/Solr等开源工具者优先;
    4. 熟悉倒排索引、全文检索、分词、排序等相关技术者优先;
    5. 具有数据敏感度及钻研精神;
    6. 有强烈的求知欲,关注行业内不断涌现的新技术,能够积极主动沟通,有很强的团队合作能力。
    请投简历至:hr@simplybrand.com

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册会员

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条


    id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_forum_2" >社区BBSid="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

    QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

    GMT+8, 2020-7-8 18:29 , Processed in 0.200952 second(s), 35 queries .

    Powered by 小雄! X3.2

    © 2014-2020 bigdataer Inc.

    快速回复 返回顶部 返回列表