配列にsumを適用 - プログラミング日記

ラシウラ: pythonでflatten (http://d.hatena.ne.jp/bellbind/20090408/1239207990)

sum()の引数は通常、数値のリストだと思うが、リストにも適用できるのは知らなかった。

>>> sum([[1], [2], [3,4]], [])
[1, 2, 3, 4]

文字列はダメらしい。

>>> sum(['a', 'b', 'c'], '')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: sum() can't sum strings [use ''.join(seq) instead]

親切にもエラーが出てjoinを使えとメッセージが出る。こういうところは、非常にPythonらしいところ。他は例えば、デフォルトでリストを辞書のキーにできないようにしているのも典型。

sumとreduceどちらが速いかということだが、+でリスト同士結合するとインスタンス作りまくりだと思われるので、どっちみち速度を気にする場合はappendするような方法にした方が良いと思う。

>>> reduce(lambda ls0, ls1: ls0.extend(ls1) or ls0, [[1], [2], [3,4]])
[1, 2, 3, 4]

ところで、Pythonのシーケンス型(の類)の判定は、isinstance(ls, (list, tuple))で良いのかな？listとtuple以外で(イテレータ以外の)シーケンスを返すものってあったかな？文字列型(の類)は厳密にはEAFPで文字列型が持つメソッド読んでみてというやり方がPythonクックブックに載っていたと思う。イテレータまで含めたiterableを判定するのはどうするのだろう？Python3でrange()やdict.keys()などは、rangeクラスやdict_keysクラスのオブジェクトを返すが、isinstance(d.keys(), types.GeneratorType)はFalseになったなあ。Pythonは厳密な型以外の型の判定は結構難しい。少なくとも推奨されている方法というのは存在しないと思われる。