Neo's Blog

链表系列-奇偶重排

Posted on 2021-01-30 Edited on 2022-11-13 In 数据结构与算法 Valine:

class Solution {
public:
    ListNode* oddEvenList(ListNode* head) {
        auto evenHead = new ListNode(-1);
        auto oddHead = new ListNode(-1);

        auto evenTail = evenHead, oddTail = oddHead;

        int k = 1;
        while (head) {
            if (k & 0x1) { //奇
                evenTail->next = head;
                evenTail = head;
            } else {
                oddTail->next = head;
                oddTail = head;
            }
            k++;
            head = head->next;
        }
        
        oddTail->next = NULL; //最后的尾巴需要设置为空
        evenTail->next = oddHead->next;
        return evenHead->next;
    }
};

链表系列-排序链表删除重复节点

Posted on 2021-01-30 Edited on 2022-03-01 In 数据结构与算法 Valine:

在一个排序的链表中，存在重复的结点，请删除该链表中重复的结点，重复的结点不保留。

样例1
输入：1->2->3->3->4->4->5

输出：1->2->5
样例2
输入：1->1->1->2->3

输出：2->3

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
class Solution {
public:
    ListNode* deleteDuplication(ListNode* head) {
        auto dummy = new ListNode(-1);
        dummy->next = head;
        auto p = dummy;
        while (p->next) {
            auto q = p->next;
            while (q->next && q->next->val == q->val) q = q->next;
            if (p->next == q) p = q;
            else {
                p->next = q->next; 
            }
        }
        
        return dummy->next;
    }
};

扩展问题：

移除重复节点，无排序版本

编写代码，移除未排序链表中的重复节点。保留最开始出现的节点。

解答思路：

借助hash来记录val之前是否出现过

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
class Solution {
public:
    ListNode* removeDuplicateNodes(ListNode* head) {
        //hash + 链表
        unordered_map<int, bool> map;

        auto dummy = new ListNode(-1);
        dummy->next = head;

        auto p = head, pre = dummy;
        while (p) {
            if (map[p->val]) { //出现过
                pre->next = p->next;
            }
            else {
                pre = p;
            }
            map[p->val] = true;
            p = p->next;
        }

        return dummy->next;
    }
};

常见系统设计题系列-分布式日志系统

Posted on 2021-01-19 Edited on 2022-02-25 In 系统设计 Valine:

ELK方案

elastic search

对日志进行分词，并建立倒排索引

log stash

日志采集

Kibana

常见系统设计题系列- DNS系统

Posted on 2021-01-19 Edited on 2022-02-25 In 系统设计 Valine:

设计DNS服务器中cache的数据结构。

要求设计一个DNS的Cache结构，要求能够满足每秒5000以上的查询，满足IP数据的快速插入，查询的速度要快。（题目还给出了一系列的数据，比如：站点数总共为5000万，IP地址有1000万，等等）

回答：

DNS服务器实现域名到IP地址的转换。

每个域名的平均长度为25个字节（估计值），每个IP为4个字节，所以Cache的每个条目需要大概30个字节。

总共50M个条目，所以需要1.5G个字节的空间。可以放置在内存中。（考虑到每秒5000次操作的限制，也只能放在内存中。）

可以考虑的数据结构包括hash_map，字典树，红黑树等等。

核心思想：估算、哈希

常见系统设计题系列-在线人数统计

Posted on 2021-01-19 Edited on 2022-03-01 In 系统设计 Valine:

问题：
求一个论坛的在线人数，假设有一个论坛，其注册ID有两亿个，每个ID从登陆到退出会向一个日志文件中记下登陆时间和退出时间，要求写一个算法统计一天中论坛的用户在线分布，取样粒度为秒。
回答：

常见系统设计题系列-URL去重

Posted on 2021-01-19 Edited on 2022-03-01 In 系统设计 Valine:

可能需要想到的思路：哈希、bloomfilter

常见系统设计题系列-积分排名系统

Posted on 2021-01-19 Edited on 2022-03-01 In 系统设计 Valine:

问题：
某海量用户网站，用户拥有积分，积分可能会在使用过程中随时更新。现在要为该网站设计一种算法，在每次用户登录时显示其当前积分排名。用户最大规模为2亿；积分为非负整数，且小于100万。

回答：

存储结构
首先，我们用一张用户积分表user_score来保存用户的积分信息。表结构：

下面的算法会基于这个基本的表结构来进行。

常见系统设计题系列-滑动TopK

Posted on 2021-01-19 Edited on 2022-03-01 In 系统设计 Valine:

实时输出最近一个小时内访问频率最高的10个IP，要求：
（1）实时输出
（2）从当前时间向前数的1个小时
（3）QPS可能会达到10W/s

常见系统设计题系列-Feed系统

Posted on 2021-01-19 Edited on 2022-02-25 In 系统设计 Valine:

Feed系统的本质就是一个相对更加简单的IM系统。

推模式

写入延迟问题：并行写入，对存储到写入压力大，更牛B的写入存储引擎：LevelDB、TokuDb等
存储量特别大：压缩率更高的存储引擎 + 定期清理数据
微博分组，更是扩大了写入量
取消关注、删除微博等操作对该模式影响也很大（可以通过读时过滤来解决）

问题重重，feed推模式，更适合粉丝有限的场景，例如朋友圈

拉模式

用户发件箱，来缓存UP最近5天发布的微博

缓存节点的带宽成本比较高，可以通过多缓存副本来解决。

推拉结合

按照用户是否活跃在线与不在线
按照UP的粉丝数来划分
区分关注的普通人与大V

常见系统设计题系列-垃圾短信

Posted on 2021-01-19 Edited on 2022-02-25 In 系统设计 Valine:

基于名单库

hash、布隆过滤器等

基于规则

人为找出规则-包含哪些词的是垃圾｜需要有样本数据，然后进行机器学习-基于出现频次

基于概率统计（朴素贝叶斯）

如果一条短信包含了A，B，C等N个词，那么这条短信是垃圾短信的概率是多少呢