struct_pack 使用提示
本文档介绍一些struct_pack的细节,包括一些优化和约束。
约束条件
struct_pack需要你的编译器良好的支持C++17标准。我们已在GCC/Clang/MSVC编译器下进行了测试
编译器 | 已测试的最低版本 |
---|---|
GCC | 9.1 |
Clang | 6.0 |
MSVC | Visual Studio 2019 (MSVC19.20) |
struct_pack是跨平台的。它可以在小端/大端,32位/64位架构下正常工作。
当启用C++20标准时,struct_pack具有更好的性能,能支持自定义的内存连续的可平凡拷贝容器。 而在C++17标准下,struct_pack仅支持标准库中已有的std::array<T>
, std::vector<T>
, std::basic_string<T>
和 std::basic_string_view<T>
,不支持其他自定义容器类型的平凡拷贝。
端序
struct_pack即使在大端架构下,也会将数据保存为小端格式。当对象的宽度大于1字节时,平凡复制优化和零复制优化将被禁用。因此,struct_pack在小端架构中的性能优于大端架构。
宏
宏 | 作用 |
---|---|
STRUCT_PACK_OPTIMIZE | 增加模板实例化的数量,通过牺牲编译时间和二进制体积来换取更好的性能 |
STRUCT_PACK_ENABLE_UNPORTABLE_TYPE | 允许序列化无法跨平台的类型,如wchar_t/std::wstring/std::bitset,请注意,这些类型序列化出的二进制数据可能无法正常的在其他平台下反序列化 |
STRUCT_PACK_ENABLE_INT128 | 允许序列化128位整数,包括__uint128和__int128类型。请注意,只有部分编译器在部分架构下支持该类型。 |
如何让序列化or反序列化更加高效
- 考虑使用string_view代替string, 使用span代替vector/array;
- 把平凡字段封装到一个单独的结构体中,优化拷贝速度;
- 尽量使用内存连续的容器(std::vector);
- 定义宏
STRUCT_PACK_OPTIMIZE
, 允许更充分的代码展开,通过牺牲编译时间和可执行文件大小的方式来加速。
类型校验
struct_pack在编译期会根据被序列化的对象的类型生成类型字符串,并根据该字符串生成一个32位的MD5并取其高31位作为类型校验码。反序列化时会检查校验码是否和待反序列化的类型相同。 为了缓解可能出现的哈希冲突,在debug模式下,struct_pack会存储完整的类型字符串。因此debug模式下生成的二进制体积比release略大。
序列化设置
struct_pack允许通过struct_pack::sp_config
来配置序列化生成的元数据内容,目前的设置项有以下几个:
枚举值 | 作用 |
---|---|
DEFAULT | 默认值 |
DISABLE_TYPE_INFO | 禁止在序列化数据中存储完整类型信息,即使在DEBUG模式下 |
ENABLE_TYPE_INFO | 强制在序列化数据中存储完整类型信息,即使不在DEBUG模式下 |
DISABLE_META_INFO | 禁用元信息和4字节的类型校验码,从而减小二进制数据的体积 |
ENCODING_WITH_VARINT | 当前结构体的整数(int32_t,int64_t,uint32_t,uint64_t)将启用变长编码 |
USE_FAST_VARINT | 对整数启用快速变长编码,该编码具有更好的反序列化性能,小字段下体积也更小 |
需要注意的是,当序列化配置了DISABLE_META_INFO选项时,必须保证反序列化也使用了该选项,否则行为未定义,大概率反序列化会失败。
此外,需要注意的是,如果结构体A嵌套了结构体B,则对A的配置不会对B生效。
假设有类型:
struct rect {
int a, b, c, d;
};
全局配置
sp_config::default
是默认情况下的全局配置,你也可以自定义默认的全局配置。
namespace struct_pack {
//设置全局默认配置
constexpr sp_config set_default(sp_config*){ return sp_config::DISABLE_ALL_META_INFO; }
}
static_assert(struct_pack::get_needed_size(rect{}).size()==16);
你可以在不同的代码单元(*.cpp文件)中声明不同的默认配置值。
通过类静态成员配置
在类中添加一个constexpr static的成员struct_pack_config即可。
该配置的优先级高于全局配置。
struct rect {
int a, b, c, d;
constexpr static auto struct_pack_config = struct_pack::DISABLE_ALL_META_INFO;
};
通过ADL配置
ADL配置的优先级高于类的静态成员。
用户只需要在类型rect
相同的namespace 下添加函数set_sp_config
即可。
inline constexpr struct_pack::sp_config set_sp_config(rect*) {
return struct_pack::DISABLE_ALL_META_INFO;
}
通过模板参数配置
该方法具有最高的优先级,要求每次序列化时都将配置作为模板参数传入。
需要注意的是USE_FAST_VARINT
和ENCODING_WITH_VARINT
配置在此处设置无效。
auto buffer = struct_pack::serialize<struct_pack::DISABLE_ALL_META_INFO>(rect{});
auto result = struct_pack::deserialize<struct_pack::DISABLE_ALL_META_INFO,rect>(buffer);
当同时配置了两者时,模板参数的优先级高于ADL。
目前我们不允许在具有compatible字段的情况下启用DISABLE_ALL_META_INFO
配置。
类型约束
- 序列化的类型必须是struct_pack类型系统中的合法类型。详见:struct_pack的类型系统。See document:struct_pack 类型系统。
- struct_pack允许新增struct_pack::compatible字段,并保证其前向/后向的兼容性,只要每次协议变更时填入的版本号大于上一次的版本号即可。如果删除/修改了已有字段,则无法保证兼容性。详见文档
- 使用YLT_REFL宏,默认最多支持注册256(msvc 默认124)个字段。不使用宏,结构体成员不应超过256个。
如何扩展结构体字段上限
有些用户需要处理一些结构体包含上百个字段的极端情况,此时字段数目可能会超过yalantinglibs支持的范围。受编译时间和编译器限制,默认支持的字段数目受限。下面我们介绍如何通过修改源码来增加字段的上限。
不使用宏的情况
默认上限为256个字段,如果需要扩展字段上限,请修改文件member_macro.hpp
,该头文件最上面有一份python代码,你可以将代码中的256改成你需要的字段数目。然后运行代码,将生成好的C++代码覆盖到member_macro.hpp中。
使用YLT_REFL宏的情况
默认上限为256个字段(MSVC默认为124个字段),我们需要注意以下问题:
编译器限制
如果您使用的是MSVC编译器,需要使用参数/Zc:preprocessor
而不是 /Zc:preprocessor-
。否则MSVC下我们最多支持反射124个字段。
修改arg_list_macro_gen.hpp文件
该头文件最上面有一份python代码,你可以将代码中的字段上限改成你需要的字段数目。然后运行代码,将生成好的代码覆盖到arg_list_macro_gen.hpp中。