-
文系エンジニアリング
【Pandas】Excelで面倒なデータ結合を簡単に実現する方法
はじめに 「複数のExcelシートのデータを一つにまとめるのが大変…」「VLOOKUPやPowerQueryは使いこなせないけど、なんとかデータを連結したい…」「シートが増えるたびに手作業でコピペするのがつらい…」 こんな経験はありませんか?私は、Excelで別々のシ... -
文系エンジニアリング
【Python】日本語CSVが文字化けするときはcp932でエンコーディングしてみよう。
はじめに 「Pythonでファイルを読み込んだら、日本語が文字化けしてしまった…😫」「utf-8で読み込もうとしたけど、エラーが出てしまう…」「丸数字(①)や株式会社(㈱)の記号が入っているファイルを読み込みたいんだけど、どうすればいいのかな?」 こん... -
文系エンジニアリング
Pythonでつくる!自動で複数のZIPに分割するファイル整理ツール
はじめに 「たくさんのファイルをまとめて送りたいけど、1つのZIPファイルだと重すぎる…」「手作業でファイルを圧縮するのが面倒…」 そんな悩みを解決するツールを、今回はPythonで作っていきます。プログラミング初心者の方でも理解できるように、基礎か... -
文系エンジニアリング
Obsidian形式のリンク(wikiリンク)を標準Markdownに一括変換するツール
はじめに こんにちは!今回は、ObsidianのMarkdownファイルを他のプラットフォーム用に変換するツールを作る方法をご紹介します。 「Obsidianで書いた記事をZennやQiitaに投稿したいけど、画像リンクやWikiリンクの形式が違うから手作業で直すのが大変…😫... -
文系エンジニアリング
Webスクレイピングでログイン処理を省略するテクニック
はじめに 「Seleniumでスクレイピングするたびに、毎回ログインするのが面倒…」「Chrome拡張機能を使ったスクレイピングがしたいけど、うまくいかない…」「普段使っているChromeの設定をそのままスクレイピングに活用できないかな…」 そんな悩みを解決する... -
文系エンジニアリング
「あれ?データが重複してる?」pandasで表記ゆれを解消!データ分析の前処理を効率化しよう
はじめに 「あれ?データが重複してる?」「同じ意味のはずなのに、別の項目として集計されてる…」 データ分析をしていると、このような表記ゆれの問題に悩まされることがよくあります。特に、人間が入力したデータは、全角・半角の違い、微妙なスペルの違... -
文系エンジニアリング
Pythonで実装するKindleのPDF化ー③PDF変換編
はじめに Kindleの電子書籍をPDF化したいと思ったことはありませんか。私は教科書など、文字を書き込みながら読みたい本は今回紹介する方法を使ってPDF化し、タブレットに読み込んで閲覧しています。 KindleのPDF化は大きく分けて以下の3つの作業に分かれ... -
文系エンジニアリング
Pythonで実装するKindleのPDF化ー②トリミング編
はじめに Kindleの電子書籍をPDF化したいと思ったことはありませんか。私は教科書など、文字を書き込みながら読みたい本は今回紹介する方法を使ってPDF化し、タブレットに読み込んで閲覧しています。 KindleのPDF化は大きく分けて以下の3つの作業に分かれ... -
文系エンジニアリング
機械学習で海外サッカーの得点数を予測してみた
はじめに サッカーというのは1点の重みが非常に大きなスポーツで、基本的に2点取ることができれば大体の試合で負けることはありません。 だからこそ得点が非常に重要になっているのですが、優勢なチームの点が取れず、劣勢のチームが点を取って勝つなど、... -
文系エンジニアリング
Pythonで作る!ファイル名に作成日を自動追加するツール📂
はじめに 「あれ?このファイル、いつ作ったんだっけ…」「写真やドキュメントが溜まりすぎて、整理が追いつかない…」 こんな経験はありませんか?特に仕事や趣味で大量のファイルを扱っていると、作成日順での管理が重要になってきます。でも、ファイル名...