Bữa ăn hôm nay là gì ?!

【 Effective Python, 2nd Edition 】デスクリプタ ( descriptor ) を利用して @property で行っていた属性値への操作を再利用できるようにしよう！投稿一覧へ戻る

Published 2020年7月16日21:55 by mootaro23

SUPPORT UKRAINE

- Your indifference to the act of cruelty can thrive rogue nations like Russia -

Ukraine official website

Ukraine official Instagram

The Official Ukrainian Marketplace - support Ukraine by shopping

@property は属性値のちょっとした操作、変更に非常に便利ですが、最大の問題点は再利用性です。

当然ながら @property のメソッドの対象はクラス内のただ１つの属性であって、複数の属性に同じ操作を適用することはできませんし、ましてや、異なるクラスで再利用することなどできません。

例えば、生徒が宿題の自主採点をして提出するためのクラスを作成し、入力された点数が 0 点から 100 点の間であるかを検証する機能を実装したとします。

class HomeWork:
    def __init__(self):
        self._grade = 0

    @property
    def grade(self):
        return self._grade

    @grade.setter
    def grade(self, value):
        if not (0 <= value <= 100):
            raise ValueError(f"値は 0 から 100 の間でなければいけません: value={value}")
        self._grade = value

@property の setter メソッドを利用することでクラスの属性への代入時に検証が行われるため非常に簡潔な実装になっていますし、使い勝手も良好、先生も手間無しです。

nana = HomeWork()
nana.grade = 90

これで味をしめた先生は、本試験でも生徒に自己採点をさせて提出させるために他のクラスを作成しました。
今回は本試験用ですから、１つのクラスで複数の教科に対応させました。

class Exam:
    def __init__(self):
        self._math_grade = 0
        self._writing_grade = 0
        self._science_grade = 0

    @staticmethod
    def _check_grade(value):
        if not (0 <= value <= 100):
            raise ValueError(f"値は 0 から 100 の間でなければいけません: value={value}")

    @property
    def math_grade(self):
        return self._math_grade

    @math_grade.setter
    def math_grade(self, value):
        self._check_grade(value)
        self._math_grade = value

    @property
    def writing_grade(self):
        return self._writing_grade

    @writing_grade.setter
    def writing_grade(self, value):
        self._check_grade(value)
        self._writing_grade = value

    @property
    def science_grade(self):
        return self._science_grade

    @science_grade.setter
    def science_grade(self, value):
        self._check_grade(value)
        self._science_grade = value

果たしてこの実装方法はどうでしょう？
見るからに冗長です。

教科 ( == 属性) が増えるたびにその属性に対する @property を記述し、検証と代入を行うために setter メソッドを実装します。
しかも、例えば期末試験用のクラスを別に作成しようとしたら、_check_grade() メソッドも含めて全てを実装し直さなければなりません。

では、検証を行う機能を Mixin クラスとして提供すればどうでしょう？

class GradeCheckMixin:
    def check_grade(self, value):
        if not (0 <= value <= 100):
            raise ValueError(f"値は 0 から 100 の間でなければいけません: value={value}")
        return value


class BetterExam(GradeCheckMixin):
    def __init__(self):
        self._math_grade = 0
        self._writing_grade = 0
        self._science_grade = 0

    @property
    def math_grade(self):
        return self._math_grade

    @math_grade.setter
    def math_grade(self, value):
        self._math_grade = self.check_grade(value)

    @property
    def writing_grade(self):
        return self._writing_grade

    @writing_grade.setter
    def writing_grade(self, value):
        self._writing_grade = self.check_grade(value)

    @property
    def science_grade(self):
        return self._science_grade

    @science_grade.setter
    def science_grade(self, value):
        self._science_grade = self.check_grade(value)

確かに、今後もし新たなクラスを作成する場合には GradeCheckMixin クラスから派生させれば _check_grade() メソッドを記述しなおす必要はなくなります。
ただし、教科が増えるたびに @property ボイラープレートを繰り返し記述しなければならないことに何ら変わりはありません。

このようなシチュエーションにおける Python でのより良い解決方法はデスクリプタ ( descriptor ) の利用です。

デスクリプタプロトコル ( descriptor protocol ) は属性に対するアクセス方法を定義するもので、
デスクリプタとして機能するオブジェクトでは __get__()、__set__()、__del__() メソッドの全て、もしくは、いずれかが定義されています。

逆に言えば、これら３つのメソッドのどれかが定義されているオブジェクトは、属性へのアクセス方法を上書きする機能を持つデスクリプタである、ということです。

そして、このデスクリプタを利用することで、複数の属性に対して同じ記述を繰り返すことなく検証コードを適用することができるようになるんです。
しかも一度デスクリプタを作成すれば他のクラスでも再利用が可能です。

例えば、Exam クラスの各教科に相当する属性へのアクセスを制御するデスクリプタとして Grade クラスを作成します。

class Grade:
    def __get__(self, instance, owner):
        pass

    def __set__(self, instance, value):
        pass


class Exam:
    """クラス属性として定義しています"""
    math_grade = Grade()
    writing_grade = Grade()
    science_grade = Grade()

この実装において Exam のインスタンスを作成し、math_grade 属性に値を代入するとします。

final_exam = Exam()
final_exam.math_grade = 80

この代入式は Python コンパイラによって次のように解釈されます。

Exam.__dict__['math_grade'].__set__(final_exam, 80)

つまり、まず最初に、Exam のインスタンスの属性辞書に 'math_grade' というキー名をもつ属性があるかどうかを調べます。

print(final_exam.__dict__)
# {}

ここでの属性はクラス属性として定義されていますからインスタンス属性の辞書には 'math_grade' というキー名は含まれていません。
そこで続いて、Exam のクラス属性辞書に 'math_grade' というキー名をもつ属性があるかどうかを調べます。

print(Exam.__dict__)
# {..., 'math_grade': <__main__.Grade object at 0x0000000002679A00>, 'writing_grade': ...}

ありました。
そこで Python はこの属性のオブジェクト ( Grade ) に __set__() が定義されているか調べ、もし定義されていれば、そこに記述されているデスクリプタプロトコルに従って処理を行う、ということになります。

属性値を取得する場合の流れも同様です。

final_exam.math_grade

という式は

Exam.__dict__['math_grade'].__get__(final_exam, Exam)

と解釈される、ということですね。

ここまででデスクリプタの動作機序は理解できたと思いますので、機能を実装してみましょう。

class Grade:
    def __init__(self):
        self._value = 0

    def __get__(self, instance, owner):
        return self._value

    def __set__(self, instance, value):
        if not (0 <= value <= 100):
            raise ValueError(f"値は 0 から 100 の間でなければいけません: value={value}")
        self._value = value


class Exam:
    math_grade = Grade()
    writing_grade = Grade()
    science_grade = Grade()


first_exam = Exam()
first_exam.math_grade = 90
first_exam.science_grade = 88


print(f"数学試験（第１回）: {first_exam.math_grade}")
# 数学試験（第１回）: 90

print(f"科学試験（第１回）: {first_exam.science_grade}")
# 科学試験（第１回）: 88

ちゃんと動作しています。
もし 0 から 100 の範囲外の値を代入しようとした場合はちゃんとエラーになります。

しかも、どうですか？
あれだけ目に付いていた @property ボイラープレートコードが一切無くなって嘘のようなスッキリさです。

気分がよくなった先生は第２回目の試験を行う、という暴挙に出ます。

second_exam = Exam()
second_exam.math_grade = 78


print(f"数学試験（第２回）: {second_exam.math_grade}")
# 数学試験（第２回）: 78

んっ、１回目よりも点数が悪くなったんじゃない？　確かめましょう。

print(f"数学試験（第１回）: {first_exam.math_grade}")
# 数学試験（第１回）: 78

あれっ、あれっ？？？？
別々の Exam クラスインスタンスなのに、なぜか値が上書きされちゃってます。

まぁ、これはある意味当然といえば当然の結果です。

Exam クラスでは各属性をクラス属性として定義しましたから、属性の実体である Grade オブジェクトは Exam クラスが最初にインスタンス化されたときに一度だけ作成され、その後他の Exam インスタンスが作成されても共有されているからです。

解決策は、Grade クラスにおいて、どのインスタンスに属する値なのか、という情報を辞書で保存するようにすることです。

class Grade:
    def __init__(self):
        self._values = {}

    def __get__(self, instance, owner):
        if instance is None:
            return None
        return self._values.get(instance, 0)

    def __set__(self, instance, value):
        if not (0 <= value <= 100):
            raise ValueError(f"値は 0 から 100 の間でなければいけません: value={value}")
        self._values[instance] = value

ただこの実装方法には欠点があります。

それは、Grade クラスの _values 辞書オブジェクトで、__set__ メソッドを経由した Exam クラスインスタンスへの参照をプログラムの実行中ずーっと保持し続けてしまっている、ということです。

そのために、それら Exam インスタンスの参照カウントはプログラム終了まで 0 にならず、いつまでたってもガーベッジコレクション ( garbage colleciton ) によるクリーンアップ対象にならない、つまり、メモリに居残ってしまうんです。つまり、メモリリーク ( memory leaks ) を発生させてしまうんです。

しかしこの問題の解決方法もちゃんとあるんですね。

それは弱参照 ( weak reference ) を利用することです。
弱参照についての説明はここでは省きますので、興味のある方は Python ドキュメントの weakref モジュールの項を覗いてください。

weakref モジュールには、キーを弱参照とする辞書を作成するための WeakKeyDictionary() メソッドが用意されています。
それを使えば、_values 辞書オブジェクトに含まれる Exam クラスインスタンスへの参照がプログラム内における最後の１つになった場合、そのクラスインスタンスはガーベッジコレクションの対象となってメモリが解放されるようになります。

from weakref import WeakKeyDictionary


class Grade:
    def __init__(self):
        self._values = WeakKeyDictionary()

    def __get__(self, instance, owner):
        if instance is None:
            return None
        return self._values.get(instance, 0)

    def __set__(self, instance, value):
        if not (0 <= value <= 100):
            raise ValueError(f"値は 0 から 100 の間でなければいけません: value={value}")
        self._values[instance] = value

この実装によって、メデタシ、一件落着です。

class Exam:
    math_grade = Grade()
    writing_grade = Grade()
    science_grade = Grade()


first_exam = Exam()
first_exam.math_grade = 95

second_exam = Exam()
second_exam.math_grade = 83

print(f"数学試験（第１回）: {first_exam.math_grade}")
# 数学試験（第１回）: 95

print(f"数学試験（第２回）: {second_exam.math_grade}")
# 数学試験（第２回）: 83

まとめ：

1: デスクリプタ ( descriptor ) で属性へのアクセス方法を制御して、@property で実現していた属性値の変更や検証を再利用可能にしましょう。

2: 必要であれば弱参照を利用してメモリリークを防止しましょう。

3: 今回は取り上げていませんが、デスクリプタプロトコルによる属性アクセス方法の制御の根本は __getattribute__ メソッドが担っています。興味を持った方は是非 Python ドキュメントに目を通してください。

この記事に興味のある方は次の記事にも関心を持っているようです...

- People who read this article may also be interested in following articles ... -

【 Effective Python, 2nd Edition 】__getattr__、__getattribute__、__setattr__ メソッドを利用して、事前に定義していないインスタンス属性を操作しよう！

【 Effective Python, 2nd Edition 】Python においてクラス属性に厳密な private が無いのは何故？できる限り利用すべきではない理由とは？それでも private の使用が有効な状況とは？

【 Effective Python, 2nd Edition 】__set_name__ デスクリプタ専用特殊関数 ( special method for descriptor ) を利用してデスクリプタインスタンスを割り当てたクラス変数名を取得し、コードの冗長性を排除しよう！

【Python 雑談・雑学】デスクリプタ ( descriptor ) をしっかりと理解しよう！

【 Effective Python, 2nd Edition 】クラス作成時の setter メソッド、getter メソッドの利用は最小限に。可能な限り public 属性によるインターフェース構築を目指しましょう

【 Effective Python, 2nd Edition 】threading モジュールの Lock クラスを利用してマルチスレッド実行時のデータ競合 ( data races ) を予防しよう！ GIL はデータ構造 ( data structure ) の安全性まで面倒を見てくれません

【 Effective Python, 2nd Edition 】組み込みタイプ ( built-in types ) を利用していてネストが深くなってきたらクラス ( class ) を作成する頃合いです、の巻

検索ガイド -Search Guide-

Bữa ăn hôm nay là gì ?!

【 Effective Python, 2nd Edition 】デスクリプタ ( descriptor ) を利用して @property で行っていた属性値への操作を再利用できるようにしよう！ 投稿一覧へ戻る

SUPPORT UKRAINE

- Your indifference to the act of cruelty can thrive rogue nations like Russia -

【 Effective Python, 2nd Edition 】デスクリプタ ( descriptor ) を利用して @property で行っていた属性値への操作を再利用できるようにしよう！投稿一覧へ戻る