多芯片分析

因为目前合并多个测序、芯片数据集这一块并没有完全统一的标准,方法大概有五六种。公说公有理婆说婆有理,对于我这样的新手来说,最简单的是跟随顶级文章的文章思路或者分析流程和步骤。

Read more

支付平台营销策略效果分析

A/B测试

A/B Test简介:

简单的说,A/B测试是在同一时间段内,给多组特征相同的用户展示优化前(对照组)与优化后(实验组)的产品,通过实验组和对照组关键指标的数据分析,验证一个新的产品的交互设计,产品功能或策略,算法的效果,得出效果是否复合预期的结论。A/B测试可以科学的检验变更的好坏,是精细化运营的必备手段

Read more

MySQL底层架构:游走在缓冲与磁盘之间

MySQL作为老牌的应用场景广泛的关系型开源数据库,其底层架构是很值得我们学习的,吸收其设计精华,那么我们在平时的方案设计工作中也可以借鉴,如果项目中用的是MySQL,那么就能够把数据库用的更好了,了解了MySQL底层的执行原理,对于调优工作也是有莫大帮助的。

Read more

利用keep-alive,快速实现页面缓存

在某一些特定场景下,跳转页面后再返回我们不希望销毁组件,而是希望页面缓存下来,保存跳转前的状态,这时候就可以用到keep-alive组件。

Read more

资源优化之路

人在做自己喜欢的事情时,时光总是过得很快。不知不觉到公司已经两年多了,在这两年的时间里,我做了很多“有趣又有用”的事情,其中最让我有成就感的有两件事:

第一,从0到1搭建了一套基于K8s的机器学习平台,高效、稳定、好用,用户访问量翻了30多倍;
第二,通过坚持不懈的资源优化,使整体资源利用率从30%左右提升到65%+,为公司节省了150+台高配机器,经济价值超过500万¥。
今天就和大家分享一下在资源优化方面的一些心路历程。

Read more

Kudu:Apache Kudu 简介和架构

Kudu是由Cloudera开源的存储引擎,可以同时提供低延迟的随机读写和高效的批量数据分析能力,他是一个融合Hdfs和Hbase功能的新组件,具备介于两者之间的新存储组件。

Read more

机器学习算法之:KNN

首先介绍一下KNN算法的几个特点:

  • KNN,全称K-Nearest Neighbor,中文名为K近邻
  • 思想极度简单,最基础的分类算法,非常适合入门
  • 应用数学知识极少,近乎为零
  • 效果却很好
  • 可以解释机器学习算法使用过程中的很多细节问题,更完整的刻画机器学习应用的流程
Read more

人工神经网络和卷积神经网络

简称神经网络(NN),是目前各种神经网络的基础,其构造是仿造生物神经网络,将神经元看成一个逻辑单元,其功能是用于对函数进行估计和近似,是一种自适应系统,通俗的讲就是具备学习能力。

Read more

如何实现领域驱动设计(DDD)

近年来,微服务已经成为一种非常流行的构建软件的方法。微服务用于构建可伸缩、灵活的软件。然而,跨多团队随机构建微服务可能会带来很大的挫折和复杂性。不久前我还没有听说过领域驱动设计——DDD,但现在无论走到哪里似乎每个人都在谈论它。

Read more