• 【干货】蒋步星:关系代数的问题及尝试

    有些传统OLAP工具能够根据维的类型自动关联,但解决得不彻底,当同一个表中出现多个同维字段时就对不上了,比如一个学生有出生地和入学地,都是地区维度,就不知道该怎么自动对应了。对于自关联的处理也很麻烦,...
    文章 2017-04-03 1103浏览量
  • SpringBoot整合Springfox-Swagger2

    paths:这里是控制哪些路径的api被显示出来,比如下方的参数就是除了/user以外的其它路径都会生成api文档 paths((String a)->a.equals("/user")) build();} private ApiInfo apiInfo(){ Contact contact=new ...
    文章 2020-04-09 754浏览量
  • 《计算机网络:自顶向下方法(原书第6版)》一1.8 小...

    分组交换网络相比,电路交换网络有哪些优点?在电路交换网络中,TDM比FDM有哪些优点?R13.假定用户共享一条2Mbps链路。同时假定当每个用户传输时连续以1Mbps传输,但每个用户仅传输20%的时间。a.当使用电路交换时...
    文章 2017-06-02 6946浏览量
  • 双11商品怎样凑?

    很明显,分组背包问题是比较适合我们的凑单问题的: 首先,我们推荐商品是基于类目的维度来推荐的,这里的类目就对应于分组M。其次,在一页推荐中,一个类目下的商品最多只出一次,相当于每组商品只能选一个。最后,...
    文章 2019-02-20 1251浏览量
  • SQL优化三步曲

    所以我们拿到问题SQL以及对应数据库环境后,登录该环境只读实例进行SQL分析测试。从以上的SQL执行计划我们可以获取到哪些有效信息呢?SQL先对t表扫描查询生产派生表,brand通过索引过滤作为表关联的驱动表,与vender...
    文章 2020-10-29 181浏览量
  • Storm(实时分布式大数据处理系统)简介

    Bolt可以完成任何事,比如:连接的过滤、聚合、访问文件/数据库、等等。Bolt从Spout中接收数据并进行处理,如果遇到复杂流的处理也可能将tuple发送给另一个Bolt进行处理。而Bolt中最重要的方法是execute(),以新的...
    文章 2015-04-17 1757浏览量
  • 成为顶尖算法专家需要知道哪些算法?

    Apriori机器学习算法工作的基本原理:如果项目集频繁出现,则项目集的所有子集也经常出现。线性回归机器学习算法 它显示了2个变量之间的关系,它显示了一个变量的变化如何影响另一个变量。决策树机器学习算法 决策树...
    文章 2018-10-11 2261浏览量
  • 《深入理解Elasticsearch(原书第2版)》——第1章 ...

    当分析器中有多个过滤器时,逐个处理,理论上可以有无限多个过滤器。过滤器可以一个接一个地被调用,因此我们可以通过逐个添加多个过滤器的方式来获得近乎无限的分析能力。最后我们介绍字符映射器,它用于调用分词...
    文章 2017-07-04 1457浏览量
  • 带你读《Apache Kylin权威指南》之三:Cube优化

    不同的分组有可能贡献出相同的Cuboid,构建引擎察觉到这点,并且保证每一个Cuboid无论在多少个分组出现,都只被物化一次,如图3-7所示。举例来说,假设有四个维度A、B、C、D,如果知道业务用户只进行维度...
    文章 2019-11-07 1490浏览量
  • MapReduce设计模式学习

    适用场景:1:需要分析各个记录的所有配对之间的关系?2:没有其他方法可以解决这个问题?3:对执行时间没有限制 等效的SQL:SELECT*FROM t1,t2?等效的PIG:CROSS a,b;五:元模式 关于模式的模式 1:作业链 针对...
    文章 2016-03-12 796浏览量
  • 产品设计怎样做才最优雅

    接下来的工作就是“针对性”的回答这些问题,确保你的设计意图是基于坚实的设计原则、研究和对细节的关注,当然啦,比如类似于风格和偏好这种问题,就非常棘手。因为不是每个设计师的都有这些意识或者是理由充足的...
    文章 2017-10-19 761浏览量
  • 通过Kubernetes监控探索应用架构,发现预期外的流量

    分组收起的状态下显示节点分组的异常占比&xff0c;展开分组可以看到特定的节点变得异常。通过该能力&xff0c;我们可以快速发现特定的微服务或者微服务关系的异常。Kubernetes 监控还具备关联分析能力&xff0c;支持查看...
    文章 2021-09-17 2浏览量
  • 文章个性化推荐靠不靠谱?万字长文详解AI内容分发的...

    摆在网络巨头们面前的问题是,如果需要建立一个大型推荐系统,协同过滤和矩阵分解则花费较长的时间。怎么办?于是,一些攻城狮将眼光转移到无监督学习中。无监督学习中的聚类算法的本质是识别用户组,并对这个组内...
    文章 2017-08-01 1299浏览量
  • 微服务治理实践|金丝雀发布

    如果新版本中基础服务出现问题瞬间影响全网用户;如果新版本有问题影响全网用户 金丝雀发布(Canary Release) 优点:灵活,策略自定义,可以按照流量或具体的内容进行灰度(比如不同账号,不同参数),出现问题...
    文章 2020-02-28 4560浏览量
  • 一个秒杀系统的设计思考

    如果将数据放到全国各地的 CDN,势必导致请求命中同一个缓存的可能性降低,那么命中率就成为一个问题因此,将数据放到全国所有的 CDN 节点是不太现实的,失效问题、命中率问题都会面临比较大的挑战。更为可行的...
    文章 2020-06-23 1582浏览量
  • 中国互联网大会:数据挖掘解决微博商业化难题

    用户推荐,一个是基于感性的,我们用到了用户的兴趣模型,用到了用户在微博历史上用了那么长时间的微博,我发现你经常收听哪些人,经常干什么,你对什么领域感兴趣,这个就是兴趣模型最直接的使用。还有一个就是...
    文章 2017-04-03 888浏览量
  • Hive性能优化(全面)

    首先,我们来看看Hadoop的计算框架特性,在此特性下衍生哪些问题?数据量大不是问题,数据倾斜是个问题。jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,...
    文章 2018-02-05 1901浏览量
  • AI时代的全链路监控,阿里工程师怎么做?

    像“交易”这样的中台业务被几十个业务方调用,总量没有异常并不代表具体的业务方没有问题,而是需要监控每一个业务方各自的调用情况,只要有一个出现异常就要预警。横向业务维度:业务全链路监控提供了“横向业务...
    文章 2018-08-29 9424浏览量
  • 机器学习温和指南

    可以将他出现哪些照片或不出现哪些照片中的信息作为经验。系统的性能可以用系统正确识别出奥巴马脸的次数比例来度量。在案例2中,系统任务是对一条推文进行情感分析。系统的经验可以是一组推文和与它们相对应的...
    文章 2017-05-02 1289浏览量
  • 跨库数据表的运算

    对应于 SQL,这种简单合并好比只是完成了 from 工作,让结构相同的跨库表的数据“纵向”拼接成了一个可以访问的序表或者游标,而实际运算中,还涉及过滤(where/having)、分组聚合(group+sum/count/avg/max/min)、...
    文章 2018-10-24 1082浏览量
  • SLS:海量日志数据管理利器

    根据日志数据,分析每个用户的行为轨迹(如何使用产品,在哪些使用场景下遇到哪些问题等),对于改善产品设计思路和运营方向都很重要。要定位细小问题。互联网化使得任何小问题被放大的概率大大增加。例如,有万分...
    文章 2016-12-25 10169浏览量
  • Hive性能优化

    首先,我们来看看Hadoop的计算框架特性,在此特性下衍生哪些问题?数据量大不是问题,数据倾斜是个问题。jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,...
    文章 2016-04-25 3230浏览量
  • Hive性能优化

    首先,我们来看看Hadoop的计算框架特性,在此特性下衍生哪些问题?数据量大不是问题,数据倾斜是个问题。jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,...
    文章 2016-04-19 3149浏览量
  • Hadoop/Spark相关面试问题总结

    之后对key进行进行sort排序,grouping分组操作将相同key的value合并分组输出,在这里可以使用自定义的数据类型,重写WritableComparator的Comparator方法来自定义排序规则,重写RawComparator的compara方法来自...
    文章 2015-07-16 1137浏览量
  • mysql面试问题总结

    mysql面试中的常见问题先说下mysql的隔离级别吧mysql的innodb引擎是如何实现可重复读的&xff1f;mvcc是如何实现的&xff1f;redolog和binlog的区别都有哪些&xff1f;mysql如何解决幻读的&xff1f;来聊聊索引吧&xff0c;innodb用...
    文章 2021-08-24 39浏览量
  • Hive性能优化(全面)

    首先,我们来看看Hadoop的计算框架特性,在此特性下衍生哪些问题?数据量大不是问题,数据倾斜是个问题。jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,...
    文章 2019-12-30 1449浏览量
  • 【NIO系列】——之TCP探秘

    此时可以定位这些问题IP,通过防火墙过滤就能解决大量的假连接问题。六、消失的连接——TIME_WAIT 在网络中,某一端主动关闭而没有通过四次握手关闭,此时tcp已经建立的通道是否还在,多久关闭?此时的TCP 状态为...
    文章 2018-06-29 2963浏览量
  • Gradle 1.12用户指南翻译——第二十三章.Java 插件

    因时间精力问题,博客中发表的译文基本不会同步修改。第二十三章.Java 插件 Java 插件向一个项目添加了 Java 编译、测试和 bundling 的能力。它是很多其他 Gradle 插件的基础服务。23.1.用法 要使用 Java 插件,请在...
    文章 2015-04-29 942浏览量
  • 高清视频下如何节省带宽?

    否则如果按 1:1 的比例分配,可能会出现,A 的上行跑不满,而节点 B 的负载过高等问题。智能分配 前面的筛选和调度,主要是针对供给侧节点信息的。而动态分配主要是针对消费侧的信息的,就是消费节点在请求节点的...
    文章 2020-06-04 342浏览量
  • Spark面试

    之后对key进行进行sort排序,grouping分组操作将相同key的value合并分组输出,在这里可以使用自定义的数据类型,重写WritableComparator的Comparator方法来自定义排序规则,重写RawComparator的compara方法来自...
    文章 2018-01-17 1647浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com