Python 3 データ構造

この節では、主に、今まで学んだ知識に基づいてPythonデータ構造を紹介します。

リスト

Pythonのリストは変更可能です。これは、リストを文字列やタプルと区別するための最も重要な特徴です。リストは変更できますが、文字列やタプルは変更できません。

Pythonでのリストのメソッドは次のとおりです。

メソッド説明
list.append(x)リストの最後に要素を追加することで、 a[len(a):] = [x]と同等です。
list.extend(L)指定したリストのすべての要素を追加してリストを拡張します。a [len(a):] = Lと同等です。
list.insert(i, x)指定した位置に要素を挿入します。 最初の引数は、その前に挿入される要素のインデックスです。たとえば、a.insert(0、x)はリスト全体の前に挿入され、a.insert(len(a)、x)は a.append(x) と同等です。
list.remove(x)値がxであるリストの最初の要素を削除します。 そのような要素がない場合、エラーが返されます。
list.pop([i])リスト内の指定された位置から要素を削除して返します。 インデックスが指定されていない場合、a.pop()は最後の要素を返します。 要素がリストから削除されます。 (メソッド内のiの前後の角括弧は、角括弧を入力させるのではなく、この引数がオプションであることを示しています。Pythonライブラリマニュアルでこのようなマークを確認できます。)
list.clear()リスト内のすべてのアイテムを削除します。del a [:]と同じです。
list.index(x)値がxであるリストの最初の要素のインデックスを返します。 一致する要素がない場合、エラーが返されます。
list.count(x)xがリストに表示される回数を返します。
list.sort()リスト内の要素を並べ替えます。
list.reverse()リスト内の要素を反転します。
list.copy()リストの浅いコピーを返します。a [:]と同じです。

次の例では、リストのほとんどのメソッドを示しています。

実例

>>> a = [66.25, 333, 333, 1, 1234.5]
>>> print(a.count(333), a.count(66.25), a.count('x'))
2 1 0
>>> a.insert(2, -1)
>>> a.append(333)
>>> a
[66.25, 333, -1, 333, 1, 1234.5, 333]
>>> a.index(333)
1
>>> a.remove(333)
>>> a
[66.25, -1, 333, 1, 1234.5, 333]
>>> a.reverse()
>>> a
[333, 1234.5, 1, 333, -1, 66.25]
>>> a.sort()
>>> a
[-1, 1, 66.25, 333, 333, 1234.5]

注意点:リストを変更するための挿入、削除、並べ替えなどのメソッドには戻り値がありません。

リストをスタックとして使用する

リストメソッドを使用すると、リストをスタックとして簡単に使用できます。スタックは特定のデータ構造として使用され、最初に入力された要素は最後に解放されます(後で入った要素は先に引き出す)。append()メソッドを使用して、スタックの一番上に要素を追加できます。 インデックスを指定せずにpop()メソッドを使用して、スタックの最上位から要素を解放できます。

実例

>>> stack = [3, 4, 5]
>>> stack.append(6)
>>> stack.append(7)
>>> stack
[3, 4, 5, 6, 7]
>>> stack.pop()
7
>>> stack
[3, 4, 5, 6]
>>> stack.pop()
6
>>> stack.pop()
5
>>> stack
[3, 4]

リストをキュー(queue)として使用する

リストをキュー(queue)として使用することもできますが、キューに追加された最初の要素が最初に取り出されます。ただし、この目的でリストを使用するのは効率的ではありません。 リストの最後に要素を追加または取り出すのは速いですが、リストの先頭から挿入または取り出すのは速くありません(他のすべての要素を1つずつ移動する必要があるため)。

実例

>>> from collections import deque
>>> queue = deque(["Eric", "John", "Michael"])
>>> queue.append("Terry")           # Terry arrives
>>> queue.append("Graham")          # Graham arrives
>>> queue.popleft()                 # The first to arrive now leaves
'Eric'
>>> queue.popleft()                 # The second to arrive now leaves
'John'
>>> queue                           # Remaining queue in order of arrival
deque(['Michael', 'Terry', 'Graham'])

リスト内包

リスト内包表記は、シーケンスからリストを作成する簡単な方法を提供します。 一般に、アプリケーションプログラムは、シーケンスの各要素にいくつかの操作を適用し、取得した結果を使用して新しいリストの要素として生成するか、特定の判断条件に従ってサブシーケンスを作成します。

各リスト内包の後にはforの式が続き、その後にforまたはif句が0個から複数以上あります。 返される結果は、式に基づいて後続のforおよびifコンテキストから生成されたリストです。 式でタプルを推測する場合は、括弧を使用する必要があります。

ここでは、リスト内の各値に3を掛けて、新しいリストを取得します。

>>> vec = [2, 4, 6]
>>> [3*x for x in vec]
[6, 12, 18]

ちょっとしたトリックをします。

>>> [[x, x**2] for x in vec]
[[2, 4], [4, 16], [6, 36]]

ここでは、シーケンス内の要素ごとに1つずつメソッドを呼び出します。

実例

>>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']

ifサブステートメントをフィルターとして使用できます。

>>> [3*x for x in vec if x > 3]
[12, 18]
>>> [3*x for x in vec if x < 2]
[]

ループやその他のテクニックは次のとおりです。

>>> vec1 = [2, 4, 6]
>>> vec2 = [4, 3, -9]
>>> [x*y for x in vec1 for y in vec2]
[8, 6, -18, 16, 12, -36, 24, 18, -54]
>>> [x+y for x in vec1 for y in vec2]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
>>> [vec1[i]*vec2[i] for i in range(len(vec1))]
[8, 12, -54]

リスト内包表記では、複雑な式またはネストされた関数を使用できます。

>>> [str(round(355/113, i)) for i in range(1, 6)]
['3.1', '3.14', '3.142', '3.1416', '3.14159']

ネストされたリスト内包

Pythonリストはネストすることもできます。

次の例は、3X4マトリックスリストを示しています。

>>> matrix = [
...     [1, 2, 3, 4],
...     [5, 6, 7, 8],
...     [9, 10, 11, 12],
... ]

次の例では、3X4マトリックスリストを4X3リストに変換します。

>>> [[row[i] for row in matrix] for i in range(4)]
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

>>> transposed = []
>>> for i in range(4):
...     transposed.append([row[i] for row in matrix])
...
>>> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

もう一つの方法。

>>> transposed = []
>>> for i in range(4):
...     # the following 3 lines implement the nested listcomp
...     transposed_row = []
...     for row in matrix:
...         transposed_row.append(row[i])
...     transposed.append(transposed_row)
...
>>> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

delステートメント

delステートメントを使用して、値ではなくインデックスでリストから要素を削除します。 これは、pop()を使用して値を返すこととは異なります。 delステートメントを使用して、リストから要素を削除するか、リスト全体を空にすることができます(前に紹介した方法は、空のリストを要素に割り当てることです)。

>>> a = [-1, 1, 66.25, 333, 333, 1234.5]
>>> del a[0]
>>> a
[1, 66.25, 333, 333, 1234.5]
>>> del a[2:4]
>>> a
[1, 66.25, 1234.5]
>>> del a[:]
>>> a
[]

delを使用して変数を削除することもできます。

>>> del a

タプルとシーケンス

タプルは、いくつかのコンマ区切りの値で構成されます。次に例を示します。

>>> t = 12345, 54321, 'hello!'
>>> t[0]
12345
>>> t
(12345, 54321, 'hello!')
>>> # Tuples may be nested:
... u = t, (1, 2, 3, 4, 5)
>>> u
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

ご覧のとおり、ネストされた構造体を正しく表現できるように、タプルの出力には常に括弧があります。 入力には括弧がある場合とない場合がありますが、通常は括弧が必要です(タプルがより大きな式の一部である場合)。

集合

集合は、順序付けられていない、繰り返されない要素のセットです。 基本的な機能には、関係のテストと重複要素の排除が含まれます。

中括弧{}を使用して集合を作成できます。 注:空の集合を作成する場合は、{}ではなくset()を使用する必要があります。後者は空の辞書を作成します。このデータ構造については、次の節で紹介します。

以下は簡単な実例です。

>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # 重複を削除する。
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket                 # メンバーを確認する。
True
>>> 'crabgrass' in basket
False

>>> # 以下は2つの集合の動作を示している。
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # aにある唯一の文字
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # aにあるがbにはない文字
{'r', 'd', 'b'}
>>> a | b                              # aまたはbにある文字
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # aとbの両方にある文字
{'a', 'c'}
>>> a ^ b                              # aまたはbにある文字だが、aとbに同時にはない
{'r', 'd', 'b', 'm', 'z', 'l'}

集合は内包表記もサポートします。

>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}

辞書

もう1つの非常に便利なPython組み込みデータ型は辞書です。

シーケンスは連続する整数でインデックスされています。違いは、辞書がキーワードでインデックスされることです。キーワードは、通常は文字列または数値など、任意の変更できないタイプになります。

辞書を理解する最も良い方法は、辞書をランダムなキー=>値のペアの集合と考えることです。 同じ辞書内で、キーワードは互いに異なっている必要があります。
中括弧のペア{}は空の辞書を作成します。

以下は辞書の使用についての簡単な例です。

>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())
['irv', 'guido', 'jack']
>>> sorted(tel.keys())
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False

コンストラクターdict()は、キーと値のペアのリストから直接辞書を作成します。 固定パターンがある場合、リスト内包表記は特定のキーと値のペアを指定します。

>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'jack': 4098, 'guido': 4127}

さらに、辞書の内包を使用して、任意のキーと値の式の辞書を作成できます。

>>> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}

キーワードが単純な文字列の場合、キーワード引数を使用してキーと値のペアを指定する方が便利な場合があります。

>>> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'jack': 4098, 'guido': 4127}

トラバーススキル

辞書をトラバースするとき、items()メソッドを使用してキーワードと対応する値を同時に解釈できます。

>>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
>>> for k, v in knights.items():
...     print(k, v)
...
gallahad the pure
robin the brave

シーケンスをトラバースする場合、enumerate()関数を使用して、インデックス位置と対応する値を同時に取得できます。

>>> for i, v in enumerate(['tic', 'tac', 'toe']):
...     print(i, v)
...
0 tic
1 tac
2 toe

2つ以上のシーケンスを同時にトラバースするには、zip()の組み合わせを使用できます。

>>> questions = ['name', 'quest', 'favorite color']
>>> answers = ['lancelot', 'the holy grail', 'blue']
>>> for q, a in zip(questions, answers):
...     print('What is your {0}?  It is {1}.'.format(q, a))
...
What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.

シーケンスを逆にトラバースするには、最初にシーケンスを指定してから、reversed()関数を呼び出します。

>>> for i in reversed(range(1, 10, 2)):
...     print(i)
...
9
7
5
3
1

シーケンスを順番にトラバースするには、sorted()関数を使用して、元の値を変更せずに順序づけされたシーケンスを返します。

>>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
>>> for f in sorted(set(basket)):
...     print(f)
...
apple
banana
orange
pear
Share

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です