Ruby 生成的代码指南
在阅读本文档之前,您应该阅读 proto2 或 proto3 的语言指南。
Ruby 的协议编译器会发出使用 DSL 定义消息架构的 Ruby 源文件。但是,DSL 仍在不断变化。在本指南中,我们仅描述生成的 message 的 API,而不是 DSL。
编译器调用
协议缓冲区编译器在使用 --ruby_out=
命令行标志调用时会生成 Ruby 输出。--ruby_out=
选项的参数是您希望编译器写入 Ruby 输出的目录。编译器为每个 .proto
文件输入创建一个 .rb
文件。输出文件名的计算方法是采用 .proto
文件的名称并进行两处更改
- 扩展名 (
.proto
) 被替换为_pb.rb
。 - proto 路径(使用
--proto_path=
或-I
命令行标志指定)被替换为输出路径(使用--ruby_out=
标志指定)。
例如,假设您按如下方式调用编译器
protoc --proto_path=src --ruby_out=build/gen src/foo.proto src/bar/baz.proto
编译器将读取文件 src/foo.proto
和 src/bar/baz.proto
并生成两个输出文件:build/gen/foo_pb.rb
和 build/gen/bar/baz_pb.rb
。编译器将在必要时自动创建目录 build/gen/bar
,但它不会创建 build
或 build/gen
;它们必须已经存在。
包
.proto
文件中定义的包名称用于为生成的 message 生成模块结构。给定一个类似于以下的文件
package foo_bar.baz;
message MyMessage {}
协议编译器会生成一个名为 FooBar::Baz::MyMessage
的输出消息。
但是,如果 .proto
文件包含 ruby_package
选项,如下所示
option ruby_package = "Foo::Bar";
那么生成的输出将优先考虑 ruby_package
选项,并生成 Foo::Bar::MyMessage
。
消息
给定一个简单的消息声明
message Foo {}
协议缓冲区编译器会生成一个名为 Foo
的类。生成的类派生自 Ruby Object
类(proto 没有公共基类)。与 C++ 和 Java 不同,Ruby 生成的代码不受 .proto
文件中 optimize_for
选项的影响;实际上,所有 Ruby 代码都针对代码大小进行了优化。
您不应创建自己的 Foo
子类。生成的类并非为子类化而设计,可能会导致“脆弱的基类”问题。
Ruby message 类为每个字段定义访问器,并提供以下标准方法
Message#dup
、Message#clone
:执行此 message 的浅拷贝并返回新拷贝。Message#==
:在两个 message 之间执行深度相等性比较。Message#hash
:计算 message 值的浅哈希。Message#to_hash
、Message#to_h
:将对象转换为 rubyHash
对象。仅转换顶级消息。Message#inspect
:返回表示此 message 的人类可读字符串。Message#[]
、Message#[]=
:通过字符串名称获取或设置字段。将来这可能也将用于获取/设置扩展。
message 类还将以下方法定义为静态方法。(通常我们更喜欢静态方法,因为常规方法可能会与您在 .proto 文件中定义的字段名称冲突。)
Message.decode(str)
:解码此 message 的二进制 protobuf 并将其返回到新实例中。Message.encode(proto)
:将此类的 message 对象序列化为二进制字符串。Message.decode_json(str)
:解码此 message 的 JSON 文本字符串并将其返回到新实例中。Message.encode_json(proto)
:将此类的 message 对象序列化为 JSON 文本字符串。Message.descriptor
:返回此 message 的Google::Protobuf::Descriptor
对象。
创建 message 时,您可以方便地在构造函数中初始化字段。以下是如何构造和使用 message 的示例
message = MyMessage.new(:int_field => 1,
:string_field => "String",
:repeated_int_field => [1, 2, 3, 4],
:submessage_field => SubMessage.new(:foo => 42))
serialized = MyMessage.encode(message)
message2 = MyMessage.decode(serialized)
raise unless message2.int_field == 1
嵌套类型
可以在另一个 message 内部声明 message。例如
message Foo {
message Bar { }
}
在这种情况下,Bar
类在 Foo
内部声明为一个类,因此您可以将其称为 Foo::Bar
。
字段
对于 message 类型中的每个字段,都有访问器方法来设置和获取该字段。因此,给定一个字段 foo
,您可以编写
message.foo = get_value()
print message.foo
每当您设置字段时,都会根据该字段的声明类型检查值。如果值类型错误(或超出范围),则会引发异常。
单一字段
对于单一基本类型字段(数字、字符串和布尔值),分配给字段的值应具有正确的类型,并且必须在适当的范围内
- 数字类型:该值应为
Fixnum
、Bignum
或Float
。您分配的值必须在目标类型中精确表示。因此,将1.0
分配给 int32 字段是可以的,但分配1.2
则不行。 - 布尔字段:该值必须为
true
或false
。没有其他值会隐式转换为 true/false。 - 字节字段:分配的值必须为
String
对象。protobuf 库将复制字符串,将其转换为 ASCII-8BIT 编码,并将其冻结。 - 字符串字段:分配的值必须为
String
对象。protobuf 库将复制字符串,将其转换为 UTF-8 编码,并将其冻结。
不会发生自动 #to_s
、#to_i
等调用来执行自动转换。如有必要,您应先自行转换值。
检查存在
使用 optional
字段时,通过调用生成的 has_...?
方法检查字段是否存在。设置任何值(即使是默认值)都会将字段标记为存在。可以通过调用不同的生成的 clear_...
方法来清除字段。例如,对于具有 int32 字段 foo
的消息 MyMessage
m = MyMessage.new
raise unless !m.has_foo?
m.foo = 0
raise unless m.has_foo?
m.clear_foo
raise unless !m.has_foo?
单一消息字段
对于子消息,未设置的字段将返回 nil
,因此您可以始终判断消息是否已显式设置。要清除子消息字段,请将其值显式设置为 nil
。
if message.submessage_field.nil?
puts "Submessage field is unset."
else
message.submessage_field = nil
puts "Cleared submessage field."
end
除了比较和赋值 nil
之外,生成的 message 还有 has_...
和 clear_...
方法,其行为与基本类型相同
if message.has_submessage_field?
raise unless message.submessage_field == nil
puts "Submessage field is unset."
else
raise unless message.submessage_field != nil
message.clear_submessage_field
raise unless message.submessage_field == nil
puts "Cleared submessage field."
end
分配子消息时,它必须是正确类型的生成的 message 对象。
分配子消息时可能会创建消息循环。例如
// foo.proto
message RecursiveMessage {
RecursiveMessage submessage = 1;
}
# test.rb
require 'foo'
message = RecursiveSubmessage.new
message.submessage = message
如果尝试序列化此内容,库将检测到循环并无法序列化。
重复字段
重复字段使用自定义类 Google::Protobuf::RepeatedField
表示。此类类似于 Ruby Array
并混合了 Enumerable
。与常规 Ruby 数组不同,RepeatedField
是使用特定类型构造的,并期望所有数组成员都具有正确的类型。类型和范围检查与 message 字段相同。
int_repeatedfield = Google::Protobuf::RepeatedField.new(:int32, [1, 2, 3])
raise unless !int_repeatedfield.empty?
# Raises TypeError.
int_repeatedfield[2] = "not an int32"
# Raises RangeError
int_repeatedfield[2] = 2**33
message.int32_repeated_field = int_repeatedfield
# This isn't allowed; the regular Ruby array doesn't enforce types like we need.
message.int32_repeated_field = [1, 2, 3, 4]
# This is fine, since the elements are copied into the type-safe array.
message.int32_repeated_field += [1, 2, 3, 4]
# The elements can be cleared without reassigning.
int_repeatedfield.clear
raise unless int_repeatedfield.empty?
RepeatedField
类型支持与常规 Ruby Array
相同的所有方法。您可以使用 repeated_field.to_a
将其转换为常规 Ruby 数组。
与单一字段不同,has_...?
方法永远不会为重复字段生成。
映射字段
映射字段使用一个特殊类表示,该类类似于 Ruby Hash
(Google::Protobuf::Map
)。与常规 Ruby 哈希不同,Map
是使用键和值的特定类型构造的,并期望所有映射的键和值都具有正确的类型。类型和范围检查与 message 字段和 RepeatedField
元素相同。
int_string_map = Google::Protobuf::Map.new(:int32, :string)
# Returns nil; items is not in the map.
print int_string_map[5]
# Raises TypeError, value should be a string
int_string_map[11] = 200
# Ok.
int_string_map[123] = "abc"
message.int32_string_map_field = int_string_map
枚举
由于 Ruby 没有原生枚举,因此我们为每个枚举创建一个模块,其中包含定义值的常量。给定 .proto
文件
message Foo {
enum SomeEnum {
VALUE_A = 0;
VALUE_B = 5;
VALUE_C = 1234;
}
optional SomeEnum bar = 1;
}
您可以像这样引用枚举值
print Foo::SomeEnum::VALUE_A # => 0
message.bar = Foo::SomeEnum::VALUE_A
您可以将数字或符号分配给枚举字段。读取回值时,如果枚举值已知,则它将是一个符号;如果未知,则它将是一个数字。由于**proto3** 使用开放枚举语义,因此任何数字都可以分配给枚举字段,即使它在枚举中没有定义。
message.bar = 0
puts message.bar.inspect # => :VALUE_A
message.bar = :VALUE_B
puts message.bar.inspect # => :VALUE_B
message.bar = 999
puts message.bar.inspect # => 999
# Raises: RangeError: Unknown symbol value for enum field.
message.bar = :UNDEFINED_VALUE
# Switching on an enum value is convenient.
case message.bar
when :VALUE_A
# ...
when :VALUE_B
# ...
when :VALUE_C
# ...
else
# ...
end
枚举模块还定义了以下实用程序方法
Foo::SomeEnum.lookup(number)
:查找给定数字并返回其名称,如果未找到则返回nil
。如果多个名称具有此数字,则返回首先定义的名称。Foo::SomeEnum.resolve(symbol)
:返回此枚举名称对应的数字,如果未找到则返回nil
。Foo::SomeEnum.descriptor
:返回此枚举的描述符。
Oneof
给定一个包含oneof的消息
message Foo {
oneof test_oneof {
string name = 1;
int32 serial_number = 2;
}
}
对应于Foo
的 Ruby 类将具有名为name
和serial_number
的成员,并像常规字段一样具有访问器方法。但是,与常规字段不同,oneof中的字段最多只能设置一个,因此设置一个字段将清除其他字段。
message = Foo.new
# Fields have their defaults.
raise unless message.name == ""
raise unless message.serial_number == 0
raise unless message.test_oneof == nil
message.name = "Bender"
raise unless message.name == "Bender"
raise unless message.serial_number == 0
raise unless message.test_oneof == :name
# Setting serial_number clears name.
message.serial_number = 2716057
raise unless message.name == ""
raise unless message.test_oneof == :serial_number
# Setting serial_number to nil clears the oneof.
message.serial_number = nil
raise unless message.test_oneof == nil
对于 proto2 消息,oneof 成员也具有单独的 has_...?
方法
message = Foo.new
raise unless !message.has_test_oneof?
raise unless !message.has_name?
raise unless !message.has_serial_number?
raise unless !message.has_test_oneof?
message.name = "Bender"
raise unless message.has_test_oneof?
raise unless message.has_name?
raise unless !message.has_serial_number?
raise unless !message.has_test_oneof?