mirror of
https://github.com/netfun2000/ip2region.git
synced 2026-02-27 09:44:31 +08:00
feat: finish all jobs
This commit is contained in:
@@ -1,79 +1,137 @@
|
||||
# ip2region xdb rust 查询客户端实现
|
||||
# `ip2region xdb rust` 查询客户端实现
|
||||
|
||||
# 使用方式
|
||||
|
||||
### 缓存整个 `xdb` 数据
|
||||
|
||||
可以预先加载整个 ip2region.xdb 到内存,完全基于内存查询,类似于之前的 memory search 查询。
|
||||
```golang
|
||||
// 1、从 dbPath 加载整个 xdb 到内存
|
||||
cBuff, err := LoadContentFromFile(dbPath)
|
||||
if err != nil {
|
||||
fmt.Printf("failed to load content from `%s`: %s\n", dbPath, err)
|
||||
return
|
||||
}
|
||||
预先加载整个` ip2region.xdb` 到内存,完全基于内存查询,该方式线程安全,采用`once_cell::sync::OnceCell`,只会加载一次数据,多线程安全,可以自由使用`tokio`异步运行时或者标准库的多线程`std::thread`
|
||||
|
||||
// 2、用全局的 cBuff 创建完全基于内存的查询对象。
|
||||
searcher, err := xdb.NewWithBuffer(cBuff)
|
||||
if err != nil {
|
||||
fmt.Printf("failed to create searcher with content: %s\n", err)
|
||||
return
|
||||
}
|
||||
配置`Cargo.toml`如下
|
||||
|
||||
// 备注:并发使用,用整个 xdb 缓存创建的 searcher 对象可以安全用于并发。
|
||||
```toml
|
||||
[dependencies]
|
||||
search = { git = "https://github.com/lionsoul2014/ip2region.git", branch = "master" }
|
||||
# 如果要在异步环境下使用,需要加上如下依赖
|
||||
tokio = { version = "1", features = ["full"]}
|
||||
```
|
||||
|
||||
# 编译测试程序
|
||||
编写`main.rs`
|
||||
|
||||
**需要使用`XDB_FILEPATH`指定`ip2region.xdb`文件的路径**,该参数可以使用相对路径或者绝对路径,如果使用相对路径报错,请修改为绝对路径
|
||||
|
||||
```rust
|
||||
use std::env;
|
||||
|
||||
#[tokio::main]
|
||||
async fn main() {
|
||||
env::set_var(
|
||||
"XDB_FILEPATH",
|
||||
"../data/ip2region.xdb",
|
||||
);
|
||||
// search_by_ip的参数可以是u32类型,字符串IP类型,字符串数字类型
|
||||
for i in 1..5 {
|
||||
tokio::spawn(async move {
|
||||
// u32
|
||||
println!("{:?}", search::search_by_ip(i));
|
||||
});
|
||||
}
|
||||
// ip str
|
||||
println!("{:?}", search::search_by_ip("1.0.1.0"));
|
||||
|
||||
// u32 str
|
||||
let ip_u32 = 1 << 24 | 1 << 8;
|
||||
println!("{:?}", search::search_by_ip(ip_u32.to_string().as_str()));
|
||||
}
|
||||
```
|
||||
|
||||
进行测试
|
||||
|
||||
```shell
|
||||
$ cargo run
|
||||
init xdb searcher at ../data/ip2region.xdb
|
||||
Ok("中国|0|福建省|福州市|电信")
|
||||
Ok("中国|0|福建省|福州市|电信")
|
||||
Ok("0|0|0|内网IP|内网IP")
|
||||
Ok("0|0|0|内网IP|内网IP")
|
||||
Ok("0|0|0|内网IP|内网IP")
|
||||
Ok("0|0|0|内网IP|内网IP")
|
||||
```
|
||||
|
||||
# 编译程序
|
||||
|
||||
通过如下方式编译得到 `ip2region` 可执行程序
|
||||
|
||||
切换到 `rust binding` 根目录,执行如下命令
|
||||
|
||||
通过如下方式编译得到 xdb_searcher 可执行程序:
|
||||
```bash
|
||||
# 切换到 golang binding 根目录
|
||||
make
|
||||
➜ cargo build -r
|
||||
```
|
||||
|
||||
生成的二进制文件会在`./target/release/ip2region`位置
|
||||
|
||||
# 查询测试
|
||||
|
||||
通过 `xdb_searcher search` 命令来测试 ip2region.xdb 的查询:
|
||||
通过 `./target/release/ip2region` 命令来测试查询
|
||||
```
|
||||
➜ golang git:(v2.0_xdb) ./xdb_searcher search
|
||||
./xdb_searcher search [command options]
|
||||
options:
|
||||
--db string ip2region binary xdb file path
|
||||
--cache-policy string cache policy: file/vectorIndex/content
|
||||
➜ ./target/release/ip2region --help
|
||||
you can set environment XDB_FILEPATH=../data/ip2region or just use --xdb in command
|
||||
Usage: ip2region [OPTIONS]
|
||||
Options:
|
||||
--xdb <xdb>
|
||||
the xdb filepath, you can set this field like ../data/ip2region.xdb
|
||||
-h, --help
|
||||
Print help information (use `-h` for a summary)
|
||||
-V, --version
|
||||
Print version information
|
||||
```
|
||||
|
||||
例如:使用默认的 data/ip2region.xdb 进行查询测试
|
||||
命令行指定参数进行查询测试,输入 `ip` 地址或者一个`u32`类型的数字进行查询即可,输入 `quit` 退出测试程序
|
||||
```bash
|
||||
➜ golang git:(v2.0_xdb) ✗ ./xdb_searcher search --db=../../data/ip2region.xdb
|
||||
➜ ./target/release/ip2region --xdb=../../data/ip2region.xdb
|
||||
init xdb searcher at ../../data/ip2region.xdb
|
||||
ip2region xdb searcher test program, type `quit` to exit
|
||||
ip2region>> 1.2.3.4
|
||||
{region:美国|0|华盛顿|0|谷歌, took:101.57µs}
|
||||
ip2region>> 1.1.1.1
|
||||
region: Ok("澳大利亚|0|0|0|0"), took: 4.227µs
|
||||
ip2region>> 2.2.2.2
|
||||
region: Ok("法国|0|0|0|橘子电信"), took: 4.495µs
|
||||
ip2region>> 222222222
|
||||
region: Ok("美国|0|康涅狄格|0|0"), took: 4.048µs
|
||||
```
|
||||
|
||||
输入 ip 地址进行查询即可,输入 quit 退出测试程序。可以设置 `cache-policy` 为 file/vectorIndex/content 来测试不同的查询缓存机制。
|
||||
或者使用环境变量
|
||||
|
||||
|
||||
# bench 测试
|
||||
|
||||
通过 `xdb_searcher bench` 命令来进行自动 bench 测试,一方面确保程序和 `xdb` 文件都没有错误,另一方面通过大量的查询得到平均查询性能:
|
||||
```bash
|
||||
➜ golang git:(v2.0_xdb) ./xdb_searcher bench
|
||||
./xdb_searcher bench [command options]
|
||||
options:
|
||||
--db string ip2region binary xdb file path
|
||||
--src string source ip text file path
|
||||
--cache-policy string cache policy: file/vectorIndex/content
|
||||
```shell
|
||||
➜ XDB_FILEPATH=../../data/ip2region.xdb ./target/release/ip2region
|
||||
init xdb searcher at ../../data/ip2region.xdb
|
||||
ip2region xdb searcher test program, type `quit` to exit
|
||||
ip2region>> 2.2.2.2
|
||||
region: Ok("法国|0|0|0|橘子电信"), took: 4.458µs
|
||||
ip2region>> 4.4.4.5
|
||||
region: Ok("美国|0|0|0|Level3"), took: 4.847µs
|
||||
```
|
||||
|
||||
例如:通过 data/ip2region.xdb 和 data/ip.merge.txt 进行 bench 测试:
|
||||
```bash
|
||||
➜ golang git:(v2.0_xdb) ✗ ./xdb_searcher bench --db=../../data/ip2region.xdb --src=../../data/ip.merge.txt
|
||||
Bench finished, {total: 3417955, took: 28.211578339s, cost: 8253 ns/op}
|
||||
# 单元测试
|
||||
|
||||
```shell
|
||||
➜ XDB_FILEPATH=../../../data/ip2region.xdb cargo test
|
||||
```
|
||||
|
||||
可以设置 `cache-policy` 参数来分别测试 file/vectorIndex/content 不同缓存实现机制的效率。
|
||||
# `bench` 测试
|
||||
|
||||
*请注意 bench 使用的 src 文件需要是生成对应的 xdb 文件的相同的源文件*。
|
||||
通过 `cargo bench` 命令来进行自动 `bench` 测试,一方面确保程序和 `xdb` 文件都没有错误,另一方面通过大量的查询得到平均查询性能
|
||||
|
||||
bench 程序会逐行读取 `src` 指定的源IP文件,然后每个 IP 段选取 5 个固定位置的 IP 进行测试,以确保查询的 region 信息和原始的 region 信息是相同。测试途中没有调试信息的输出,有错误会打印错误信息并且终止运行,所以看到 `Bench finished` 就表示 bench 成功了,cost 是表示每次查询操作的平均时间(ns)。
|
||||
在不同机器上面的测试性能时间是不一样的,如下是在机器`CPU`是`Intel(R) Core(TM) i7-9750H CPU @ 2.60GHz`,内存`DDR4 32G`下面的测试结果
|
||||
|
||||
```shell
|
||||
➜ XDB_FILEPATH=../../../data/ip2region.xdb cargo bench
|
||||
// --snip--
|
||||
Running benches/search.rs (target/release/deps/search-9614305a566885c4)
|
||||
Benchmarking ip_search_bench: Warming up for 3.0000 sinit xdb searcher at ../../../data/ip2region.xdb
|
||||
ip_search_bench time: [120.84 ns 122.91 ns 125.20 ns]
|
||||
change: [-3.3346% -1.2786% +0.8027%] (p = 0.23 > 0.05)
|
||||
No change in performance detected.
|
||||
Found 6 outliers among 100 measurements (6.00%)
|
||||
6 (6.00%) high mild
|
||||
```
|
||||
|
||||
可以看到上面的`ip_search_bench time`一行的参数表示是左右值分别显示置信区间的下限和上限,中间值显示 `Criterion.rs` 对基准程序每次迭代所用时间的最佳估计
|
||||
|
||||
Reference in New Issue
Block a user