做为热身,从一些简单的例子开始,
1 | def f1 |
若你用的是 ruby1.9 及以上的版本,还可以这样,
1 | f3(-> {puts "f3"}) |
上面是 block, proc 和 lambda 的一些基本用法。
block
先说说 block, ruby 中的 block 是方法的一个重要但非必要的组成部分,们可以认为方法的完整定义类似于,
1 | def f(零个或多个参数, &p) |
注意&p 不是参数,&p 类似于一种声明,当方法后面有 block 时,会将 block 捕捉起来存放到变量 p 中,如果方法后面没有 block,那么&p 什么也不干。
1 | def f(&p) |
从上面代码的运行结果可以知道&p 不是参数
1 | def f(a) |
所以任何方法后面都可以挂载一个 block,如果你定义的方法想使用 block 做点事情,那么你需要使用 yield 关键字或者&p
1 | def f1 |
此时 f1, f2 执行时后面必须挂一个 block,否则会抛出异常,f1 抛出 LocalJumpError: no block given (yield) 的异常,f2 抛出 NoMethodError: undefined method ‘call’ for nil:NilClass 的异常, ruby 提供了block_given?
方法来判断方法后面是否挂了 block,于是们可以这样修改 f1 和 f2,
1 | def f1 |
这样的话,f1 和 f2 后面无论挂不挂 block 都不会抛异常了。 们再来看看 f2 修改前抛出的 NoMethodError: undefined method ‘call’ for nil:NilClass 异常,这种说明当 f2 后面没有挂 block 的时候 p 是 nil,那么们给 f2 挂个 block,再打印出 p,看看 p 究竟是什么,
1 | def f2(&p) |
这说明 p 是一个 Proc 实例对象,在 ruby 中,&还可以这么用,[1,2] & [2,3]
或者 puts true if 1 && 1
或者在某个类中将它作为一个方法名。
很多 ruby 老鸟会写类似下面的代码,
["1", "2", "3"].map(&:to_i)
,其效果和["1", "2", "3"].map {|i| i.to_i }
一样, 但简洁了许多,并且更加拉风。 这里的魔法在于符号&会触发:to_i 的 to_proc 方法, to_proc 执行后会返回一个 proc 实例, 然后&会把这个 proc 实例转换成一个 block,们需要要明白 map 方法后挂的是一个 block,而不是接收一个 proc 对象做为参数。&:to_i 是一个 block,block 不能独立存在,同时你也没有办法直接存储或传递它,必须把 block 挂在某个方法后面。
:to_i 是 Symbol 类的实例, Symbol 中的 to_proc 方法的实现类似于,
1 | class Symbol |
同理们可以给自己写的类定义 to_proc 方法,然后使用&耍下酷,比如,
1 | class AddBy |
在 ruby 中, block 有形,它有时候是这样
1 | do |...| |
有时候是这样
1 | {|...| ...} |
或者类似 &p, &:to_i, &add_by_9 之类,但是它无体,无体的意思就是说 block 无法单独存在,必须挂在方法后面,并且你没有办法直接把它存到变量里,也没有办法直接将它作为参数传递给方法,所以当你想存储,传递 block 时,你可以使用 proc 对象了,
1 | p = Proc.new(&:to_i) |
虽然在开发中经常用到 block,但是很少显式地去使用 Proc 或 proc 去实例化 block,比如几乎没有写过这样的代码,
1 | f(Proc.new {|...| ...}) |
在使用 block 时,会忽略 proc 的存在,将 proc 定位为一个幕后的工作者。经常写类似下面的代码,
1 | def f(...) |
有些新手会写类似下面的一执行就会报错的代码,
1 | def f(..., &p) |
也有这样写的,
1 | def f(..., &p) |
或者
1 | def f(...) |
甚至写过类似下面的代码,
1 | def f(...) |
我们经常在该挂 block 的时候,却把 proc 对象当参数传给方法了, 或者不明白&p 就是 block 可以直接交给方法使用,曾经也犯过这样的错误就是因为没有把 block 和 proc 正确的区分开来, &p 是 block, p 是 proc,不到万不得已的情况下不要显式地创建 proc,每当对 block 和 proc 之间的关系犯糊涂时,就会念上几句。
再来聊聊 yield 和&p,我们经常这样定义方法,
1 | def f(...) |
yield 和 call 后面都可以接参数,如果你是这样定义方法
1 | def f(...) |
那么可以这样执行代码,
1 | f(...) do |i, j| |
但是这样做也不会有错,
1 | f(...) do |
p.call(…) 的情况类似, 也就是说 block 和 proc 都不检查参数 (其实通过 proc 方法创建的 proc 在 1.8 是严格检查参数的,但是在 1.9 及以上的版本是不检查参数的),为什么 block 和 proc 不检查参数呢?其实这个很好理解,因为在实际应用中你可能需要在一个方法中多次调用 block 或者 proc 并且给的参数个数不一样,比如,
1 | def f() |
由于方法后面只能挂一个 block,所以要实现上面的代码功能,就不能去严格检查参数了。
转入正题,这两种方式效果差不多,都能很好地利用 block。使用 yield,看起来简洁,使用&p,看起来直观,并且你可以将&p 传给其他方法使用。 但是在 ruby1.8 的版本你不应像下面这样做,
1 | def f1(...) |
可以,
1 | def f2(..., &p) |
当然上面这种用法很少见,但是却被碰到了,经常写一些方法去请求外部的 api,有时这些外部的 api 不是特别稳定,时不时会遇到一些 bad respoense, timeout 错误,针对这些错误,应该立即重发报文重试,对于其他异常就直接抛异常。于是写了一个 try 方法来满足这个需求,
1 | def try(title, options = { }, &p) |
最开始用的是 yield,结果在 ree 下执行 try 方法时会报错,后来改成使用&p 就通过了。
通过试验发现在 ruby1.9 及以上版本已经没有这种差异了。
做个小结, block 和 proc 是两种不同的东西, block 有形无体,proc 可以将 block 实体化, 可以把&p 看做一种运算,其中&触发 p 的 to_proc 方法,然后&会将 to_proc 方法返回的 proc 对象转换成 block 。
其中 proc 对象的 to_proc 方法返回自身。
1 | p = proc {} |
lambda
lambda 是匿名方法, lambda 和 proc 也是两种不同的东西,但是在 ruby 中 lambda 只能依附 proc 而存在,这点和 block 不同,block 并不依赖 proc。
1 | l = lambda {} |
在 ruby1.8 中输出的信息类似 #Proc:0x0000000000000000@irb):1( 在 ruby1.9 及以上版本输出的信息类似 #Proc:0x007f85548109d0@irb):1lambda)(,注意 1.9 及以上版本的输出多了 (lambda)**,从这里可以理解 ruby 的设计者们确实在有意的区分 lambda 和 proc,并不想把 lambda 和 proc 混在一起,如同 ruby 中没有叫 Block 的类,除非你自己定义一个,ruby 中也没有叫 Lambda 的类,于是将 lambda 对象化的活儿就交给了 Proc,于是令人头大的情况出现了,当你用 lambda 弄出了一个匿名方法时,发现它是一个 proc 对象,并且这个匿名方法能干的活,proc 对象都能做,于是们这些码农不淡定了,Proc.new {}
这样可以, proc {}
这样也没有问题, lambda {}
这样做也不错, ->{}
这个还是能行,平时吃个饭都为吃什么左右为难,现在一下子多出了四种差不多的方案来实现同一件事情,确实让人不好选择,特别是有些码农还有点小洁癖,如果在代码里一会儿看到proc{}
, 一会儿看到lambda{}
,这多不整洁啊,让人心情不畅快。在这里们认定 lambda 或者 -> 弄出的就是一个匿名方法,记做 **l, 即使它披着 proc 的外衣,proc 或者 Proc.new 创建的就是一个 proc 对象,记做 p 在 ruby 各个版本中, l 和 p 是有一些差别的。
定义一些方法,
1 | def f0() |
lambda 和 proc 之间的区别除了那个经常用做面试题目的经典的 return 之外,还有一个区别就是 lambda 不能完美的转换为 block(这点可以通过 f3 和 f4 执行的过程得证),而 proc 可以完美的转换为 block,注意,说的 lambda 指的是用 lambda 方法或者->符号生成的 proc,当然和方法一样 lambda 是严格检查参数的,这个特点也和 proc 不一样。
从上面的数据对比来看,在 1.8 版本,lambda 和 proc 方法生成的 proc 对象的行为是一致的,但在 1.9 以上和 jruby 的版本中,lambda 和 proc 的不同处增多,可以认为 ruby 的设计者们并不想把 lambda 和 proc 混同为一件事物。如前面所讲,proc 的主要作用是对象化 block 和 lambda,并且 proc 在行为上更接近于 block。
retrun 的几个试验
1 | def f0() |
如果你能够理解 proc 在行为上更像 block,lambda 其实就是方法只不过是匿名的,那么你对上面的结果不会感到惊讶。
如果把 f0,f1 做一些修改,就更容易理解上面的结果了。
1 | def f0() |
return 只能在方法体里执行,
1 | p = Proc.new { return 0 } |
构造 p 的时候没有使用 proc {return 0},因为在 ruby1.8 中, proc {return 0}的行为和 lambda 一样,比如在 ruby1.8 中,
1 | def f(p) |
感觉 proc 中的 return 能记住 proc 生成时其 block 的位置,然后无论 proc 在哪里调用,都会从 proc 生成时其 block 所在位置处开始 return,有下面的代码为证:
1 | def f(p) |
在 1.8, ree, jruby, 1.9, 2.0 各版本都测试过,结果一样。
再看看下面的代码,
1 | def f0(&p) |
们重点看看 f3 中的 proc p,它虽然是从 f2 中生成返回的,但是 p 生成时其 block 是处在在 f3 的方法体内,这个类似于,
1 | def f3() |
所以执行 f3 时,没有异常抛出,返回 0。
总结
当你想写出类似于 f do …; end 或者 f {…}的代码时,请直接使用 block,通过 yield, &p 就能达到目的,当你想使用 proc 时,其实此时绝大部分的情况是你实际想用 lambda,请直接使用 lambda{}或者->{}就可以了, 尽量不要显示地使用 Proc.new{} 或者 proc{}去创建 proc。
废话说了一大堆,其实最想说的是: 用 block,用 lambda,不要用 proc,让 proc 做好自己的幕后工作就好了。