Urllib.Request と urlopen() を使用した Python インターネット アクセス
urllib とは?
urllib は、URL を開くために使用できる Python モジュールです。 URL アクションに役立つ関数とクラスを定義します。
Python を使用すると、XML、HTML、JSON などのインターネットからデータにアクセスして取得することもできます。また、Python を使用してこのデータを直接操作することもできます。このチュートリアルでは、Web からデータを取得する方法を見ていきます。たとえば、ここでは guru99 ビデオ URL を使用しました。Python を使用してこのビデオ URL にアクセスし、この URL の HTML ファイルを出力します。
このチュートリアルでは、学びます
- Urllib を使用して URL を開く方法
- Python で URL の HTML ファイルを読み取る方法
Urllib を使用して URL を開く方法
コードを実行してインターネット データに接続する前に、URL ライブラリ モジュールまたは「urllib」のステートメントをインポートする必要があります。
- urllib をインポート
- 主な機能を定義する
- 変数 webUrl を宣言します
- 次に、URL ライブラリ ライブラリで urlopen 関数を呼び出します
- 私たちが開いている URL は youtube の guru99 チュートリアルです
- 次に、結果コードを出力します
- 作成した webUrl 変数で getcode 関数を呼び出して、結果コードを取得します
- これを文字列に変換して、文字列「結果コード」と連結できるようにします
- これは通常の HTTP コード「200」になり、http リクエストが正常に処理されたことを示します
Python で HTML ファイル形式の URL を取得する方法
Python の「read 関数」を使用して HTML ファイルを読み取ることもできます。コードを実行すると、コンソールに HTML ファイルが表示されます。
- webURL 変数で read 関数を呼び出す
- 読み取り変数により、データ ファイルの内容を読み取ることができます
- URL のコンテンツ全体を data という変数に読み込みます
- コードを実行 - データが HTML 形式で出力されます
これが完全なコードです
Python 2 の例
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 の例
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)
Python