Shen Jianan's blogFreedom as Autonomy hbase java redis ruby 分布式 基数统计 机器学习 神经网络 笔记 算法 算法引擎 论文 java Java并发编程实战 读书笔记 redis Redis设计与实现——事件 Redis设计与实现——AOF持久化 Redis设计与实现——RDB持久化 Redis设计与实现——数据库列表与结构体 Redis设计与实现——SDS哈希表 Redis设计与实现——SDS实现与代码解读 ruby Ruby元编程 星期五 Ruby元编程 星期四 Ruby元编程 星期三 Ruby元编程 星期二 Ruby元编程 星期一 分布式 Raft概论 BigTable论文阅读&个人翻译 《HBase实战》随笔——数据操作 机器学习 优化神经网络表现的几种方法 反向传播背后的四个基本等式 神经网络基础知识 机器学习 ex6 核函数 神经网络反向传播计算过程笔记 算法 基数统计:从Linear Counting到Hyper LogLog 再探排序 简单搜索二叉树&红黑树小结 线性时间排序 快速排序算法小结 算法引擎 Faiss向量召回引擎如何做到快速查找最近邻 shen_jianan@foxmail.com © 2015 - 2020 Shen Jianan的随缘更新 Powered by Hugo with theme Dream.
基数统计:从Linear Counting到Hyper LogLog Wednesday, Nov 11, 2020 @ Shen Jianan 应用场景 基数统计(Cardinality Counting)指计算一个数据集中不同元素的数量,在很多场景都需要这样的功能:电商场景中的独立用户(UV)数量统计、数据库中快速计算字段取值数量以优化query、计算与某个站点相关的不同链接数量等。 10 minute read
About Me 2018.02至今 杭州嘉云数据 算法引擎 2017.6-2017.12 菜⻦网络-⼈工智能部-算法引擎 2016.09-2018.06 南京大学研究生 2015.07-2015.09 阿里巴巴-ICBU-实习 2012.09-2016.06 南京大学本科