Divide and Conquer
[Python] 크롬 북마크 정리 1 본문
728x90


- 크롬 - 북마크 관리자 - 우측 상단의 ⁝ 눌러서 북마크 내보내기
- html로 북마크 파일 저장, 파일 열기
- F12 눌러서 개발자 환경 확인
from bs4 import BeautifulSoup
with open("C:/Users/012vi/Desktop/bm0514.html",encoding='UTF8') as html:
soup = BeautifulSoup(html, "html.parser")
soup # html 파일의 모든 소스코드를 읽어옵니다
A = soup.find_all('a')
B = soup.findAll('a')
if A == B:
print('true')
elif A != B :
print('false')
# true
url=[]
cnt = 0
for i in A:
cnt += 1
url.append(i.attrs['href'])
len(url) # 25
url # 링크만 읽어집니다
url2=[]
cnt = 0
for i in soup.findAll('a'):
cnt += 1
url2.append(i.string)
len(url2) # 25로 같음을 보여줌
url2 # 즐겨찾기의 저장 이름만 저장
url_d ={}
cnt = 0
for i in A:
cnt += 1
url_d[i.string] = i.attrs['href']
print(url_d) # 딕셔너리로 저장한 이름과 링크를 저장 후 출력
# 줄 바꿈이 되지 않아 보기 힘들어서 딕셔너리 전용 출력으로 바꿈
from pprint import pprint as pp
pp(url_d)
"""
{'BRIC': 'https://m.ibric.org/main/',
'Baekjoon': 'https://www.acmicpc.net/',
'CodeUp': 'https://codeup.kr/index.php',
...
'프로그래머스': 'https://programmers.co.kr/'}
잘 보이네요
"""반응형
'성장캐 > 기타' 카테고리의 다른 글
| [환경세팅] Raspberry Pi OS install (0) | 2021.09.26 |
|---|---|
| 행렬 계산기 사이트 (0) | 2021.05.07 |
| [Python] Tesseract를 이용한 OCR (0) | 2021.05.06 |
| 기본 이메일 앱에서 카카오톡 메일 연동 (0) | 2021.05.04 |
| [티스토리] 티스토리에서 PDF 보기 (0) | 2021.05.03 |
Comments