プログラムとか 思ったこととか 徒然ブログ 投稿一覧へ戻る

タグ "normalization" が付いている投稿一覧

【Python 雑談・雑学 + coding challenge】Unicode の正規化処理 ( normalization ) を利用して、diacritical marks ( 発音区別符号 ) を取り除こう! テキスト解析の前処理としても重要です!

Tags: Python , miscellaneous , challenge , diacritical , unicode , normalization

Published 2020年9月24日21:35 by T.Tsuyoshi

問題 ( 制限時間: 45 分 ): 私の元にこんな内容のファイルが送られてきました (ファイル名は 'greek_str.txt' とします)。 δοκῶ μοι περὶ ὧν πυνθάνεσθε οὐκ ἀμελέτητος εἶναι. καὶ γὰρ …