앞으로 다 잘 될 거야

고정 헤더 영역

글 제목

메뉴 레이어

앞으로 다 잘 될 거야

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기 (27)
    • python (8)
      • pandas (1)
      • beautifulsoup (1)
    • 블로그 환경설정 (1)
      • 코드블럭 (1)
    • TOPIC (2)
    • COUPANG (12)

검색 레이어

앞으로 다 잘 될 거야

검색 영역

컨텐츠 검색

python

  • [python] Chrome Webdriver 업데이트 없이 selenium(셀레니움) 실행하는 방법

    2024.04.28 by 진실의종아울려라

  • [python] OCR 기능 활용, 이미지에서 한글 텍스트 읽어오기 (with 네이버 클로바 OCR)

    2024.04.13 by 진실의종아울려라

  • [Pandas] pandas 설치 및 엑셀(excel) 데이터 처리 방법 소개

    2022.08.14 by 진실의종아울려라

  • [Python] 내포 활용 예시(딕셔너리, 리스트, 정렬)

    2022.08.07 by 진실의종아울려라

  • [Python] 리스트 평탄화 - 내포 활용

    2022.08.07 by 진실의종아울려라

  • [Python] 리스트 내포 if / else 구문 사용 방법

    2022.08.06 by 진실의종아울려라

  • [python] datetime

    2022.06.02 by 진실의종아울려라

  • [HTML] 태그

    2022.05.08 by 진실의종아울려라

[python] Chrome Webdriver 업데이트 없이 selenium(셀레니움) 실행하는 방법

저는 selenium 을 활용해서 웹페이지 자동화나 크롤링 등을 처리하고 있는데, 기존에는 아래 링크에서 현재 크롬 버전에 맞게 Chrome Webdriver 다운 받고 코드를 실행했었습니다. ChromeDriver - WebDriver for Chrome - DownloadsCurrent Releases If you are using Chrome version 115 or newer, please consult the Chrome for Testing availability dashboard. This page provides convenient JSON endpoints for specific ChromeDriver version downloading. For older versions of Ch..

python 2024. 4. 28. 12:57

[python] OCR 기능 활용, 이미지에서 한글 텍스트 읽어오기 (with 네이버 클로바 OCR)

결론부터 말하자면, python 에 설치하는 모듈로 원하는 *OCR 결과를 얻어오기는 어렵습니다. * OCR: 광학 문자 인식(Optical Character Recognition) easy ocr, pytesseract ocr 등 활용하여 python에서 OCR 해봤으나, 사용할만한 수준의 데이터를 얻어오기 어려워 다른 방법을 찾아냈습니다. 바로, 네이버 클로바 OCR 을 활용해서 텍스트를 엑셀로 변환하고, 엑셀을 pandas로 읽어 데이터 처리하는 방법입니다. 저의 경우, 스캔한 pdf 파일에서 텍스트 정리하는 업무에 활용하기 위해 OCR이 필요했고, 네이버 클로바 OCR을 활용한 결과는 만족스러웠습니다. pdf 파일 이미지로 변환 ▶ 이미지 OCR 후 엑셀 저장 ▶ pandas로 데이터 처리 순서로..

python 2024. 4. 13. 18:35

[Pandas] pandas 설치 및 엑셀(excel) 데이터 처리 방법 소개

이번 글에서는 pandas 설치방법과 excel 데이터 처리 방법을 소개합니다. 1. Pandas 설치 및 업데이트 pip install pandas 터미널에 pip install pandas를 입력합니다. (Visual Studio Code에서 진행) 저의 경우, 이미 pandas가 설치되어 있기 때문에 Requirement already satisfied 라는 문구가 뜨네요. 대신 새로운 버전으로 업데이트가 가능하다고 알려줘서 초록색으로 표기된 명령어를 그대로 복사하여 실행합니다. python.exe -m pip install --upgrade pip 2. Excel 데이터 읽어오기 예를 들어 성적.xlsx 라는 파일이 있을 때, pandas를 활용해 데이터를 읽어와보도록 하겠습니다. import p..

python/pandas 2022. 8. 14. 00:02

[Python] 내포 활용 예시(딕셔너리, 리스트, 정렬)

파이썬 매일 코딩 e-book을 구매해서 공부 중에 다양한 자료구조, 정렬, 내포를 활용하는 문제가 있어서 풀이 방법을 정리하려고 한다. 책 자체에 별도 해설은 없는 것 같은..? Q) 부모(parent) - 자식(child) 간 관계 및 나이가 아래와 같을 때, 나이 순으로 자식 이름을 리스트로 출력하는 함수 만들기 [ 리스트 내포(list comprehension) 활용 ] # A의 자식: B(20살) / C(10살) / D(30살) # E의 자식: F(5살) / G(15살) diagram = { 'A' : [{'B':20}, {'C':10}, {'D':30}], 'E' : [{'F':5}, {'G':15}] } 내가 푼 방법은 아래와 같은데, 처리 순서를 3개로 구분해보면 ① 이름과 나이를 요소로 ..

python 2022. 8. 7. 17:16

[Python] 리스트 평탄화 - 내포 활용

리스트가 중첩되어 있을 때, 내포를 활용해서 아래와 같이 각 리스트의 요소만 뽑아낼 수 있다. * for문을 2번 사용하면 되고, 뒷쪽에 더 안쪽 요소에 접근하는 for문을 사용하면 된다. nested_list = [ [1,2], [3,4,5], [6,7,8,9] ] flatten_list = [ element for sub_list in nested_list for element in sub_list ] # [1, 2, 3, 4, 5, 6, 7, 8, 9] # sub_list는 [1,2] / [3,4,5] / [6,7,8,9] # 참고) 행을 띄워서 적어도 됨 # flatten_list = [ element # for sub_list in nested_list # for element in sub_li..

python 2022. 8. 7. 15:49

[Python] 리스트 내포 if / else 구문 사용 방법

파이썬에서 내포는 변환(map) / 필터링(filter) 작업을 동시에 할 수 있는데, 리스트 내포를 활용할 때, 조건에 해당하는 것만 출력할 때는 [ ① 표현식 ② for ③ if ] 순으로 작성하면 된다. [예시 1] 0~9 범위 내에서 짝수인 경우만 제곱해서 리스트 출력 [ x**2 for x in range(10) if x%2==0 ] # [0, 4, 16, 36, 64] if / else 조건 모두 활용하는 경우 [ ① (if 조건일 때) 표현식 ② if ③ else + (else 조건일 때) 표현식 ④ for ] 순으로 작성하면 된다. [예시 2] 0~9 범위 내에서 짝수인 경우만 제곱하고, 홀수는 세제곱하여 리스트 출력 [ x**2 if x%2==0 else x**3 for x in rang..

python 2022. 8. 6. 22:02

[python] datetime

datetime 모듈에서 datetime, timedelta 함수 import from datetime import datetime, timedelta 문자열을 날짜로 변환 datetime.strptime(string,format) format 설명 예시 %Y 네자리 수 연도 2021, 2022 %y 두자리 수 연도 21,22 %m 0이 채워진 월 01,02,...,11,12 %d 0이 채워진 일 01,02,...,30,31 %Y-%m-%d 년-월-일 2022-06-02 시분초 제외 날짜만 표현 datetime.date() 날짜를 문자열로 변환 datetime.strftime(date,format) datetime에서 날짜 계산 str_to_date_minus = str_to_date - timedelt..

python 2022. 6. 2. 23:32

[HTML] 태그

BeautifulSoup를 통해 데이터를 가져올 때, 필요한 태그에 대해 알아봅니다. ※ 공부한 자료 정리용으로, 새로 알게되는 내용이 있으면 지속적으로 업데이트 예정입니다. 태그는 기본적으로 꺽쇠()로 쌓여져 있습니다. , , , , , , , , , , , , , , , ... 태그 명칭이 어떤 단어에서 유래된건지 알면, 어떤 역할을 하는지 대부분 유추할 수 있습니다. 아래는 많이 사용되는 태그에 대해 간단히 설명한 자료입니다. BeautifulSoup를 활용해서 데이터를 읽어올 때, 어떤 값을 읽어오는 것인지에 대한 대략적인 이해만 하면 되고 html, css 구조에 대해 정확히 아실 필요는 없는 것 같습니다. html은 웹사이트의 전체적인 틀 및 구성이라고 생각하시면 되고, css는 얼마나 웹사이..

python/beautifulsoup 2022. 5. 8. 17:27

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
앞으로 다 잘 될 거야 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바