[Erlang]前人挖坑,后人还要进坑?

来源:互联网 发布:淘宝网中老年棉袄 编辑:程序博客网 时间:2024/06/09 18:33

1. 保护式(guard)中如果出错,不会报错,只会返回false!

复制代码
case 1=:1 of     true when not erlang:length(t) =:= 1 orelse true ->           ok;     _ ->         errorend.
Result is:   error
复制代码

保护式中对t (atom) 求length会出错,本应crash掉,但因为在保护式中,默认出错后结束此保护式计算并返回false,这也是为什么保护式不接受复杂的函数,只能用erlang的bif来做的原因之一。

2. try catch 时如果不写catch类型,默认为throw类型!

复制代码
try_catch(Value) ->    try        case Value  of            error -> erlang:error({error,plz_catch_me});            throw -> erlang:throw({throw,oh_get_you});            exit -> erlang:exit({exit,sorry_by_mistake})        end    catch        T -> T    end.
复制代码

Result :

try_catch

所以最好是:明确: Catch   throw:T –> {throw,T}; error:T –> {error,T}; exit:T –> {exit,T} end.

 

3. 在保护式中使用erlang:length/1要小心再小心!(要遍历列表,时间长度不定)

复制代码
%%写成这样的耗时与列表长度成平方比:Do not do thisfoo(List) when lenght(List) >0 ->         do_something;foo(_) ->       done.%%使用匹配模式来做可做到任意长度断定better([One]) ->       do_something_one();better([One,Two]) ->       do_something_two();better([one,Two|_]) ->       do_something_big();better([]) ->      do_something_empty()end.
复制代码

Tip:  如果要判定List是一个非空List 可用 case List of [_|_] –> do_something(); _ –> done end.

4. ++只是lists:append/2的一个别名:如果要用一定要确定 ShortList++LongList !(可记为长短的反义短长…每次用他我都会条件反射想一下)

%% DO NOT DOnaive_reverse([H|T]) ->    naive_reverse(T)++[H];naive_reverse([]) ->    [].

which is the most inefficient way there is to reverse a list. Since the ++ operator copies its left operand, the result will be copied again and again and again... leading to quadratic complexity.

这是最没效率去反转一个list,”++“会复制左边的元素,这个会使复制多次,导致平方倍的复杂度。

但是另一方面:下面这种用法就好了:

 
%% OKnaive_but_ok_reverse([H|T], Acc) ->    naive_but_ok_reverse(T, [H]++Acc);naive_but_ok_reverse([], Acc) ->    Acc.

这并不是一个是非常坏的尝试,每个列表元素只被copy一次,那增长的Acc是在++的右边的,他不会每次都被copy的

当然,最佳实践还是下面这种:

%% Best Dovanilla_reverse([H|T], Acc) ->    vanilla_reverse(T, [H|Acc]);vanilla_reverse([], Acc) ->    Acc.

这比上面的还要高效一点点,你根本不用去建造一个list元素,直接copy他就可以了(或者:如果编译器不把[H]++Acc重写为[H|Acc] ,那就更高效啦)。

5. receive 和case的区别很大,虽然写法类似:

复制代码
case_test(Value) ->    case Value of        1 -> ok;        2 -> error    end.receive_test(Value)when Value>2 ->    PID = spawn(fun () ->        receive            {msg,1} ->                ok;            {msg,2} ->                error        end    end),    [begin PID ! {msg,ValueT} end ||ValueT<-lists:seq(3,Value)],    PID.
复制代码

Result:

recieve

从上面可以看出:

5.1 case如果没有匹配就会出错;

5.1 recieve 会在没有匹配消息时阻塞,只要信箱中没有匹配消息,就会在等待期间挂起,=有新消息到时才会被唤醒,每次执行时,receive会先检查最老的消息(位于队列头部),像在case表达式中那样尝试匹配,如果找不到,就会继续下一消息,如果与当前匹配成功,且保护式成立(如果有),此消息就会被移出信箱,同时子句对应的正文会被执行,如果一直没找到合适消息就会一直等待至超时(如果有的话,after Times).

6. erl 用-noshell –noinput 启动一个node时,看不到,又不能输入怎么调试?用-remsh参数

复制代码
>erl -name foo@127.0.0.1 -setcookie 123456 -noshell -noinput>erl -name bob@127.0.0.1 -setcookie  123456 -remsh foo@127.0.0.1%%注意起的节点叫foo哦,不是bob了!foo@127.0.0.1> nodes().foo@127.0.0.1>['bob@127.0.0.1']foo@127.0.0.1>node().foo@127.0.0.1>'foo@127.0.0.1'
复制代码

这里的坑在于:

6.1 在remote出来的节点上调用q(),2个节点都会退出!好可怕,所有最好把q()这个函数在user_default.erl里面重写,让他不要执行init: stop().

6.2 window下要用werl 代替erl;

6.3 erl支持自定义参数,比如你写erl –rmsh test 也是不会报错的,如果不小心写错了,就会查好久……..

Tip: 已 起A,B二个节点,要用A 控制B,可以在A中使用Ctrl+G  r  NodeA j  2操作  具体见:Learn some erlang remote shell.

 

7.如果有一个ArgList 是:从不可知道的地方传过来是这样子:”[test1,test2,test3]”,要怎么使用才能动态执行?

场景:知道方法调用的方法:Method 使用 erlang:apply(Module,Method,ArgList)调用产生结果,这时的ArgList是不符合格式:

%% String = "[test1,test2,4]."注意最后面的结束小句号!string_to_args(String) ->    {ok, Scan1, _} = erl_scan:string(String),    {ok,P}=erl_parse:parse_exprs(Scan1),    {value,Value,[]} = erl_eval:exprs(P, []),    Value.

以上合适List中所有的参数都是绑定的:,如果是有Test1这样的变量,我也没试过,还没遇到这种需求悲伤

可以参考

 

8. erl 启动参数可以自己定义:如

复制代码
>erl -test erlang1  -test hello -test1 test1>init:get_argument(test).{ok,[["erlang1"],["hello"]]>init:get_arguments().[{root,["C:\\Program Files\\erl6.0"]}, {progname,["erl"]}, {home,["C:\\Users\\**"]}, {test,["erlang1"]}, {test,["hello"]}]
复制代码

8.1  不要把参数定义为string了:比如 “hello world”

8.2 如果这个是启动application启动用的,就不要指望用这个自定义的参数了,用config定义吧

Applications should not normally be configured with command line flags, but should use the application environment instead. Refer to Configuring an Application in the Design Principles chapter for details

 

9.使用RPC时一定要记得你是在distributed的,时刻关注你在那个进程!

比如:把rpc:call放在loop里面和外面会得到不一样的效率反馈,以下这例子的结果是等价的,但是第一种会发出很多的call,第二种只有一个call.

复制代码
%%Example - Bad[rpc:call(node, ets, lookup, [table, K]) || K <- ListOfKeys].%%Example - Goodrpc:call(node, ?MODULE, get_data, [ListOfKeys, []]).get_data([], Out) -> lists:reverse(Out);get_data([K|ListOfKeys], Out) -> get_data(ListOfKeys, [ets:lookup(table,K)|Out]).
复制代码

同理你可以自己改一下:[gen_server:call(Pid,{func,Fun})||Fun<- FunList].

总之要能一次发消息处理的就不要多次发啦.
10 不要构造超极大的terms(或者你不可控制大小的terms). 
具体就是如果要遍历ets里面所有的元素,用ets:tab2list/1得出来的结果可能什么非常大,这可怎么办啊!
复制代码
%% 一次性也出所有元素:不要这样子做bad_traverse_to_print() ->    [begin print(Person) end||Person <- ets:tab2list(person)],    ok.%%从第一个一直遍历到最后一个:数据要从erts内部搬到process 当ets很大的时候就效率低good_traverse_to_print() ->    good_traverse_to_print2(ets:first(person)).good_traverse_to_print2('$end_of_table') ->    ok;good_traverse_to_print2(Key) ->    [Person] = ets:lookup(person,Key),    print(Person),    good_traverse_to_print2(ets:next(person,Key)).%%分页:最佳实践使用ets:select match MatchSpec:ets内部实现了把matchspec编译成opcode 然后eval的时候把需要的数据才拷贝到process去 大大减少了数据量best_traverse_to_print() ->    case ets:match(person,'$1',10) of        {PersonList,'$end_of_table'} ->            [begin print(Person) end|| [Person] <- PersonList];        {PersonList,Key} ->            [begin print(Person) end|| [Person] <- PersonList],            best_traverse_to_print2(Key)    end,    ok.best_traverse_to_print2(Key) ->    case ets:match(Key) of        {PersonList,'$end_of_table'} ->            [begin print(Person) end|| [Person] <- PersonList];        {PersonList,Key2} ->            [begin print(Person) end|| [Person] <- PersonList],            best_traverse_to_print2(Key2)    end.print(Person) ->    io:format("Name~p     Phone:~p~n",[Person#person.name, Person#person.phone]),    ok.
复制代码

第10条和第9条是看似矛盾的,一个说如果可以一次处理完就不要分多次,一个是如果太大就要分多次!注意,如果一个消息体太大了,也要分多次哦。


11.每次重装系统时都会重新安装Erlang,Ubuntu安装sh秒杀一切.

     https://gist.github.com/zhongwencool/11174620

12. Erlang Shell隐藏的小技巧:

复制代码
    f(). %%把所有绑定变量释放掉    f(Val). %%把Val变量释放掉    v(Line). %%把Line行函数重新执行一次    v(-1). %%把前一行的函数重新执行一次    rr(Module).%%把Module中的Record加载到Shell中,【超有用】    rr("*/*"). %%把在这个子目录下的所有Module里面的Record给加载到Shell里面    rp(Expression).%%把Expression的全部元素给打印到shell里面【超有用】
     rl(). %%列出所有已定义过的Record.rf(RecordName).%%不加载名为RecordName的Record
     %%如果你的code加了debug_info信息【compile:file(Module,[debug_info])】你可以这样看源代码    {ok,{_,[{abstract_code,{_,AC}}]}} = beam_lib:chunks(Beam,[abstract_code]),    io:fwrite("~s~n", [erl_prettypr:format(erl_syntax:form_list(AC))]).
复制代码

13. Erlang中有很多不可逆函数:比如 binary_to_list/1 , list_to_binary/1

  > binary_to_list(list_to_binary([ <<1,2>>,<<3,4>>])).    [1,2,3,4]

    这个坑有点深,踩过才知道!这还有个和binary一起的小Tip:

   > <<"xyz","ets","bt">> =:= <<"xyzetsbt">>.                true

    binary居然是等价的。

14.在保护式里面 ,等价于andalso ;等价于orelse------[但是:不是完全相同,原因如下]

   %%相同点:   right_age(X) when X >= 16, X =< 104 -> %% X>=16 andalso X =< 104    true;   right_age(_) –>    false.

     不同点:

    %%当Condition1异常出错时,还会去判断Condtion2,如果使用orelse则会直接返回false    func() when Condition1 ; Condition2 –>       ok;    func() –>      error.

     可以和http://www.cnblogs.com/zhongwencool/p/3712909.html 第一条对比一下,理解更深哦。

15.如果你想在实践中使用二叉树,请看gb_tree.erl,不要再造不必要的轮子啦,【不过可以考虑用来做练习】

16. 在try catch 的异常处理中禁止使用尾递归:

      因为在这个异常处理部分有一个保护机制,Erlang绝对相信异常处理是正常的,如果你在这里面使用尾递归,会出现以下情况:

    1) 尾递归变死循环啦【项目实践中可能会发生的】;    2) 非常多的进程进入了这个异常中,这个尾递归处理的东西又非常复杂,VM运行长久后,block大量的进程和消耗内存

      这样的结果是:内存耗尽或程序特别慢,关键你还是查找不到最后的crash的原因。

      所以推荐:异常处理中只使用必要且简单的处理就行了

17. 如果你想在Erlang中 kill一个进程:找到Pid后,exit(Pid,Reasno).【效果和kill一样啦】

      大部分情况不会起作用!!!!!因为在项目里面你的进程如果合规范都是在监控树下的,如果被exit/2后还会被监控树自动重启啦,所以你要先把进程移除监控树!!!

    supervisor:terminate_child(SupPid,Pid),     supervisor: delete_child(SupPid,Pid).

18. 2个进程可以双向连接和单向连接:

     双向: link(Pid1,Pid2). 重复调用效果一样,也就是说对同2个进程无论调用多少次link,只要使用一次unlink(Pid1,Pid2)就解除连接

     单向:erlang:monitor/2   erlang: demonitor/1

19. receive  after Time

      这个Time最大值是50*24*60*60*1000,当时间大于50天时,就会报错:

      所以要把Time拆成小于最大值的列表:

  normalize(Time) –>      Limit = 49*24*60*60,      [Time rem Limit | lists:duplicate(Time div Limit, Limit)].

      然后如果时间列表不为空就不断减少列表并等待直到列表为空:

复制代码
  loop([T|Next]}) –>     receive        {Server, Ref, cancel} –>           Server ! {Ref, ok}        after T*1000 –>           if Next =:= [] –>               Server ! {done, S#state.name};              Next =/= [] –>              loop(Next})           end     end.
复制代码

20. gen_server里面的handle_call/3 和handle_cast/2返回值都可以加个Timeout时间。

     如果这个时间内没有处理完就会发出一个timeout信息:由handle_info处理,具体可见:http://www.cnblogs.com/zhongwencool/p/erlang_timer.html 里面的方法二。


21.在生成随机数过程中一直使用:

random:seed(erlang:now()).

erlang:now()是可以一直递增的数,从不重复,但是不适合用于随机算法,最好使用下面这种

-spec get_random_num(integer()) -> integer().get_random_num(Max) ->    <<A:32, B:32, C:32>> = crypto:rand_bytes(12),    random:seed({A,B,C}),    random:uniform(Max).

22.Pid的那3位数字<A,B,C>代表着什么?

  • A, 对应是哪一个节点 (0 代表是本地节点 ,其它数字代表远程节点) ;
  • B, 低15字节代表进程唯一记数(一个进程表的索引)
  • C, 16~18字节也是进程唯一记数(和B一样)

http://stackoverflow.com/questions/243363/can-someone-explain-the-structure-of-a-pid-in-erlang

验证如下:

打开一个终端test1

打开终端test2

23.gen_server进程如果长期不需要处理其它消息,可以使用返回值{noreply,hibernate}进入休眠状态:使用场景:

比如使用者知道在处理完一个特定的消息后这个进程在很长一段时间内不会再有消息处理,可以设定这个消息的返回后进入hibernate状态!

这可以减少内存和cpu消耗。

24.Record这么好用,为什么还是有很多大神吐槽record非常不好?

缺点:

%%1.只能使用原子作为index元素;%% 2.编译前就确定了结构,不能动态的增加index,比如person要增加一个phone属性,record是做不到的。

所以17后就有了Map这个数据结构,可以突破上面的限制,真正的Map.

http://www.cnblogs.com/zhengsyao/p/erlang_map_brief.html

但是目前的mnesia只支持record的。不支持map,那Record的升级麻烦还会在mneisa中继续存在的。

25. receive 里面after的妙用:

进程阻塞时,用于清空进程信箱消息

receive  Msg ->           do_something(Msg);after 0 ->      do_something2)end.

关键看清楚那个after 0 ,调用这个函数就会把这个进程以前旧的消息都用do_something(Msg)处理掉:(当然你的do_something/1里面会尾递归调用回这个函数啦)

25.ETS 的默认限制个数为1400个,你可以通过:

erl -env ERL_MAX_ETS_TABLES Number

来改变这个默认值,但是这个限制也提示了一个非常重要的信息:不要尝试每一个进程都建立一个ets表!

26. 不要跨节点连接或监控(link,monitor)很多进程:

因为如果节点由于网络故障通信断了,那么所有link或monitor的进程会被马上触发,产生超大量的消息分给超多的进程,这就会给系统增加非常大的负担。

27.使用receive 嵌套实现接收消息的先后关系

复制代码
receive       {first_deal_msg,Msg} ->                 do_someting(Msg),                  receive                        {second_deal_msg,Msg2} ->                              do_someting2(Msg2)                  endend.
复制代码

28.Erlang为什么叫Erlang?(哈哈,乱入一通):

erlang

n.厄兰(话务单位),占线小时;

名副其实的为通信而先的语言哇…

29.begin end语句块的简洁使用:
问题描述:
将一堆人随机平均分开2组,,怎样去平均?

当然效率不高,但是!看上去很cool…

30. split_binary/2

It is usually more efficient to split a binary using matching instead of calling the split_binary/2 function. Furthermore, mixing bit syntax matching and split_binary/2 may prevent some optimizations of bit syntax matching.

使用比特语法来分离二进制比用split_binary/2更加高效,更进一步来讲,混合使用比特语法和split_binary/2会把编译器弄sb的(不会进行相关的优化任务了)

DO

<<Bin1:Num/binary,Bin2/binary>> = Bin,

DO NOT

{Bin1,Bin2} = split_binary(Bin, Num)

转自:http://blog.csdn.net/erlib/article/details/40743849

0 0
原创粉丝点击