• 以讲解性能作为 Kafka 之旅的开篇之作,让我们一起来深入了解 Kafka “快”的内部秘密。你不仅可以学习到 Kafka 性能优化的各种手段,也可以提炼出各种性能优化的方法论,这些方法论也可以应用到我们自己的项目之中,助力我们写出高性能的项目。
    MageByte

    发布于:1 天前

  • 在互联网数据化运营实践中,有一类数据分析应用是互联网行业所独有的——路径分析。路径分析应用是对特定页面的上下游进行可视化展示并分析用户在使用产品时的路径分布情况
    vivo互联网

    发布于:11 天前

  • Apache Calcite快速入门与核心学习指导,带你快速掌握Calcite的基础用法
    xpleaf

    发布于:28 天前

  • 深入理解Flink中的 checkpoint 机制
    园陌

    发布于:2021-01-27 20:18:54

  • 我们在数仓项目的时候往往是需要将它分层的,但是为什么分层你真正的了解过吗,那它分层的好处又是什么呢。好我们今天就针对这个话题进行讲解,点赞,点赞,点赞 重要事情说三遍。
    大数据老哥

    发布于:2021-01-03 21:31:46

  • 在业务增涨过程中,每个企业不知不觉积累积累了一些数据。无论数据是多是少,企业都希望让“数据说话”,通过对数据的采集、存储、分析、计算最终提供对业务有价值信息。 此时,大数据平台的搭建就是企业面临的问题,搭建大数据平台有哪些思路?怎么样的搭建路径可以让企业少走弯路?什么样的架构是业内标准?通过什么手段来分析和展示已有的数据? 或许这些问题会萦绕在您的心头,那么今天就一起来看看如何解答它们吧。
    51CTO崔皓 专栏作者

    发布于:2020-05-30 19:48:56

  • Phoenix整合HBase,像操作MySQL一样操作HBase
    兴趣e族

    发布于:2020-03-31 18:58:00

  • 前言虽然同花顺之类的金融理财应用的数据足够好了,但还是有自己定制的冲动,数据自然不会不会比前者好很多,但是按照自己的想法来定制还是不错的。目标通过免费的数据接口获取数据,每日增量更新标的历史交易数据,然后通过Kibana做可视化及数据分析.其实自己通过echarts之类的可视化框架做可视化也是个不错的选择,不过前期成本太大。还有就是pandas+matplotlib已经足以应付大部分需求了,可是交
    youerning 专栏作者

    发布于:2019-07-27 12:32:05

    阅读 10000+ 评论 0 收藏 1
  • maxwell生产项目实操
    Stitch_x

    发布于:2019-06-28 17:17:26

  • 一、何为分布式文件文件系统分布式文件系统(DistributedFileSystem)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连,它的设计是基于客户端/服务器模式。如上图所示,应用服务器和文件服务器分别存在于网络当中,而这里的网络,可以是统一子网,也可以是不同子网。服务器对文件的存取,均在网络进行,这样就可以突破常用存储设备的容量限制。二、常用分布式文件
    司徒晓宇

    发布于:2018-12-12 16:48:39

    阅读 10000+ 评论 10 收藏 17
  • 本文将分别使用 `Python` ,`Golang` 以及 `GraphQuery` 来解析某网站的素材详情页面, 通过这个页面的解析过程,深入浅出的了解爬虫的解析思想与这些语言之间的异同。
    Ox1管理员

    发布于:2018-11-02 10:31:28

  • 分布式爬虫系统设计、实现与实战:爬取京东、苏宁易购全网手机商品数据+MySQL、HBase存储
    xpleaf

    发布于:2018-04-02 20:32:10

    阅读 10000+ 评论 54 收藏 11
  • 前言我很在意的一件事情是好看,嗯,好看.以及是否有趣.虽然不一定有用.下面是效果图,由于数据量有限,所以还不够眼花缭乱.本文的主要内容是通过echarts,threejs将web日志或者任何含有IP数据的文本文件可视化.简单的来说,装逼,可以将这个动态图放在大屏幕上.所有源码及相关数据文件请访问下面github仓库https://github.com/youerning/blog/tree/mas
    youerning 专栏作者

    发布于:2018-03-28 17:45:12

    阅读 10000+ 评论 14 收藏 9
  •     很多年以前,不知道怎么就听说,有个小小的转换器,能够把汽车CAN总线转接为串口,然后,就出现了再转成蓝牙或者WIFI接口的小设备。这个小设备能够获取OBD II标准的数据。OBD II的标准广泛用在各种汽车控制器上,能够通过这些数据获得汽车的各种状态数据和告警。    于是很多牛人基于这个小玩意,在电脑特别是手机上开发了不少应用。通过蓝牙或
    HaoHu

    发布于:2018-03-01 09:35:47

    阅读 10000+ 评论 0 收藏 0
  • HBase作为淘宝全网索引构建以及在线机器学习平台的核心存储系统,是阿里搜索基础架构的重要组成部分。本文我们将介绍HBase在阿里搜索的历史、规模,应用的场景以及在实际应用当中遇到的问题和优化。
    小圈子

    发布于:2017-08-01 11:06:39

    阅读 10000+ 评论 4 收藏 1
  • 阿里妈妈,是一个想让天下没有难做的营销的大数据平台,它拥有阿里巴巴集团的核心商业数据。在这里,每天有超过50亿的推广流量完成超过3亿件商品的推广展现,覆盖高达98%的网民,实现数字媒体(PC端+无线端+互联网电视端)的一站式触达。 在这些鲜亮的数据背后,是什么样的核心算法在起作用?它如何保证商家的产品得到最有效的推荐?本文将给大家详解阿里妈妈 CTR 预估核心算法 MLR 的研发背景和应用实践。
    小圈子

    发布于:2017-07-18 08:36:24

    阅读 10000+ 评论 1 收藏 0
  •    定制化 大数据平台一键安装OS大数据平台一键安装OS系列大数据平台一键安装OS【搭建脚本篇】定制化OS镜像制作1.操作环境操作环境:VMware Workstarion 9 and vSphere client系统:CentOS -6.8-x86_64工具:gconf-editor anaconda repodata createrepo mkisofs rsync2.主
    大数据陈浩 专栏作者

    发布于:2017-06-29 16:13:11

    阅读 10000+ 评论 7 收藏 3
  • MySQL大数据的优化以及分解存储
    tty之星

    发布于:2017-06-21 09:44:52

    阅读 10000+ 评论 2 收藏 9
  • “花瓶”模型v5.0在安全理念上变化很大,主要是网络抽象出虚拟层,内容安全从网络层中剥离,认证和授权从应用系统中剥离,适应虚拟化IT基础架构,符合源信息加密的发展趋势。模型v5.0在部署架构上,吸纳了大数据技术,首先将大数据处理技术引入,处理海量安全数据,其次采用基于大数据的关联分析技术,对用户网络行为、业务合规性关联分析;引入威胁情报技术,应对高级威胁***。可以说:模型v5.0着实落实了“数据驱动安全”的新安全理念,将安全保障方案设计,提升到网络安全防护建设的新阶段。
    zhaisj

    发布于:2017-05-04 11:21:57

    阅读 10000+ 评论 1 收藏 0
  • 就在2017年4月11日,Gartner的著名分析师Anton Chuvakin在其Gartner官方博客上称“企业和组织如果打算自建安全数据湖或者定制自己的大数据安全分工具的话,那么基本上肯定会失败”!Anton以自己在跟客户沟通中了解到的信息作为佐证,说包括一些财富50强在内的企业在几年前自建的所谓安全分析项目耗费了大量资源,但收效甚微。有的客户表示“我宁愿希望我们从未听说过Hadoop这个东
    叶蓬

    发布于:2017-04-13 23:37:37

    阅读 10000+ 评论 0 收藏 1
  • 今天给大家介绍的内容主要包括以下四个部分首先是介绍一下美团大数据平台的架构,然后回顾一下历史,看整个平台演进的时间演进线,每一步是怎么做的,以及一些挑战和应对策略,最后总结一下,聊一聊我对平台化的看法。    谢语宸是来自美团的大数据构建平台的架构师。他在QCon2016北京站分享了一些整体上构建大数据平台的方法,除了聚焦在某一个点上的还有构建整体的大数据,以及各种各样技术的应
    jackwxh

    发布于:2017-02-21 13:53:10

    阅读 10000+ 评论 2 收藏 7
  • 挨踢部落是为核心开发者提供深度技术交流,解决开发需求,资源共享的服务社群。基于此社群,我们邀请了业界技术大咖对开发需求进行一对一突破,解除开发过程中的绊脚石。以最专业、最高效的答复为开发者解决开发难题。
    51CTO编辑部

    发布于:2016-12-30 14:44:53

  • 活动说明:挨踢部落是为核心开发者提供深度技术交流,解决开发需求,资源共享的服务社群。基于此社群,我们邀请了业界技术大咖对开发需求进行一对一突破,解除开发过程中的绊脚石。以最专业、最高效的答复为开发者解决开发难题。话题关键词: 大数据  spark  数据分析  数据画像部落阵容:徐韬,龙珠直播大数据主管;王劲,数果科技 联合创始人;面向对
    51CTO编辑部

    发布于:2016-12-30 14:39:48

  • 阅读目录:背景安装下载elasticsearch servicewrapper 包elasticsearch servicewrapper开源包的配置小bugservicewrapper安装chkconfig -add 加入linux启动服务列表查找、下载rpm包 、执行rpm包安装配置elasticsearch专属账户和组设置elasticsearch文件所有者切换到elasticsearch专
    王清培

    发布于:2016-10-16 19:33:24

    阅读 10000+ 评论 0 收藏 1
  • 鉴于数据安全和合规的要求,企业数据中心在目前混合云架构下,对公共云和私有云上的业务系统做数据备份是一个必然面对的趋势。
    xjsunjie 专栏作者

    发布于:2016-05-05 16:28:04

  • 其实运维工程师手里拥有大量资源,但是无论上级或者运维工程师本人却不予重视,一方面是是因为编程的一定门槛,再者就是画地为牢,不过像我这样的运维工程师,应该可能也不太像个传统的运维工程师了吧,毕竟最本质的职责是对于系统的维护,以及故障处理等,在本文的数据再利用的三个方面,我想大多数同行觉得第一层利用就远远足够了,不过随着时代的发展,数据爆发式的增长的今天,我们真的能对自己手上的大量资源,不闻不问么。
    youerning 专栏作者

    发布于:2015-12-19 16:44:48

    阅读 10000+ 评论 5 收藏 5
  • 我的转变.
    泪雨画晴

    发布于:2015-06-20 01:22:04

  • 大数据备份和恢复应用案例--通过分区表备份和恢复数据海量数据备份和恢复方案     对于OLAP的数据库的业务特点,是将批量的数据加载入库,然后对这些数据进行分析处理,比如报表或者数据挖掘,最后给业务提供一种决策支持;另外,这类数据库的数据实时性非常高,一旦这些数据处理完毕后,就很少再次使用(有时,也需要对这类数据进行查询)。 对于OLAP数据库的备份和恢复
    客居天涯

    发布于:2014-11-19 10:08:08

  • 大数据时代的全能日志分析专家--Splunk安装与实践0.背  景随着大家对网络安全意识的提高,企业网管理人员,必须对IT基础设置进行监控及安全事件的管理,管理数据的数量和种类非常巨大,那么就需要有一款能否分析各种日志数据的工具,经过长期实践,为大家推荐Splunk这么一款全能型分析工具。1.Splunk简介Splunk是一款功能强大的、记录详细的日志分析软件,Splunk是基于原始日志
    李晨光

    发布于:2014-09-03 16:14:47

  • ? ? 周未跟一做人才外包服务朋友聊天,提到自己正在学习大数据技术的时候。他直接就说到他现在有需求,但就是招不到合适的人才。然后提到说现在大数据人才的价值,收入,待遇方面。可以说基本上将近到IT行业的顶级了。不由得,就开始思考,大数据人才的价值到底在什么地方?大数据思维? ? 个人感觉,这是首先第一个需要有的。因为我们现阶段生活在一个数据爆炸的时代,掌握良好
    bingyang87628

    发布于:2014-08-25 10:05:28

推荐作者 更多
最新热评文章
51cto_blog:您的许多公式都没有展示出哦~
51cto_blog:博主大大,您的内容很优秀,如果整体更系统一些,公式都显示出来,会容易上推荐哦~
cisco_learner:大佬666
wx5fa649a288d1f:希望对您有帮助
写文章 申博娱乐现金网
网站地图 ag真人百家乐 网上百家乐 申博电子游戏 申博138官网
www.183msc.com 菲律宾申博娱乐登入 777老虎机支付宝充值 申博太阳城现金网
申博娱乐手机版 申博直营网 777老虎机游戏 申博代理开户
申博 真人百家乐 申博登录网址 菲律宾太阳城申博
申博现金网 申博官网 百家乐 申博手机下载版