平均查找性能提高了 715 倍，Linux 6.2 合并华为贡献的代码_地址_升序_符号

Linux 6.2 今日合并了来自华为郑磊（Zhen Lei，音译）的代码，将核心内核功能的速度提高了 715 倍。

在合并代码模块介绍中写道：“得益于 Zhen Lei 的代码， Tux（Linux 的吉祥物，这里指 Linux）在 kallsyms_lookup_name 平均查找性能提高了 715 倍，将我们的旧实现从 O (n) 升级到 O (log (n))，同时还保留了 / proc / kallsyms 上的旧实现支持”。

IT之家了解到，kallsyms_lookup_name 函数用于根据一个符号的名称查询其地址，并可用于内核符号表内任何符号的查询。

华为的 Zhen Lei 在之前的补丁贴中描述了对 kallsyms_lookup_name 的优化：

目前，为了搜索一个符号，我们需要将 'kallsyms_names' 中的符号逐一展开，然后使用展开后的字符串进行比较。这是 O (n)。

如果我们像地址一样将名字按升序排序，我们也可以使用二进制搜索。而这就是 O (log (n))。

为了不改变“/proc/ kallsyms”的实现，表 kallsyms_names [] 仍然以升序与地址一一对应的方式存储。

增加数组 kallsyms_seqs_of_names []，它以排序后的名字的序列号为索引，对应的内容是排序后的地址的序列号。

例如，假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引是 'i'，kallsyms_seqs_of_names [i] 的内容是 'k'，那么 NameX 的对应地址是 kallsyms_addresses [k]。kallsyms_names [] 中的偏移是 get_symbol_offset (k)。

注意，内存使用量将增加 (4 * kallsyms_num_syms) 字节，接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。

展开全文

目前，为了搜索一个符号，我们需要将 'kallsyms_names' 中的符号逐一展开，然后使用展开后的字符串进行比较。这是 O (n)。

如果我们像地址一样将名字按升序排序，我们也可以使用二进制搜索。而这就是 O (log (n))。

为了不改变“/proc/ kallsyms”的实现，表 kallsyms_names [] 仍然以升序与地址一一对应的方式存储。

增加数组 kallsyms_seqs_of_names []，它以排序后的名字的序列号为索引，对应的内容是排序后的地址的序列号。

注意，内存使用量将增加 (4 * kallsyms_num_syms) 字节，接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。

性能测试结果（在 x86 平台上）：

之前：

min=234, max=10364402, avg=5206926

min=267, max=11168517, avg=5207587

之后：

min=1016, max=90894, avg=7272

min=1014, max=93470, avg=7293

kallsyms_lookup_name 的平均查询性能提高了 715 倍。这是 kallsyms_lookup_name 一次重大改进，也是 Linux 6.2 的圣诞礼物。

END

官方站点：

Linux命令大全：

（新群，火热加群中……）

特别声明

本文仅代表作者观点，不代表本站立场，本站仅提供信息存储服务。

上一篇 : 鲜Meta | 文娱 x 元宇宙，八大视频平台如何「各尽其用」?（爱优腾芒篇）_宇宙_虚拟_腾讯

下一篇 : 中国杀马特消亡史：曾有20万成员，火遍全网，为何逐渐消失了？_马特_头发_自己的

平均查找性能提高了 715 倍，Linux 6.2 合并华为贡献的代码_地址_升序_符号

特别声明

历史之最

相关专题

平均查找性能提高了 715 倍，Linux 6.2 合并 华为 贡献的代码_地址_升序_符号

特别声明

相关文章

历史之最

相关专题

平均查找性能提高了 715 倍，Linux 6.2 合并华为贡献的代码_地址_升序_符号