일상(3)
-
python에서 tesseract 사용하기
그제 tesseract을 통해 사진에서 글 추출에 성공했고 오늘은 python에서 tesseract를 사용하여 한 폴더 내의 사진 파일을 계속해서 추출하여 한 문서에 저장하는 것이 목표다 import pytesseract from PIL import Image #시작 시 사진 시작, 끝 번호 입력받기 startNum = int(input("시작 번호는? : ")) endNum = int(input("끝 번호는? : ")) totalNum = endNum - startNum + 1 #전체 사진 수만큼 반복 num = [] for i in range(0,totalNum, 1): num.append(startNum + i) #밑 " "에 사진이 저장되어 있는 주소 삽입. path = "c:\\Users\\hi..
2020.04.25 -
tesseract 사용해보자
책을 읽으면서 한글 파일에 옮겨야 하는 알바가 있다. 근데 너무 노가다...이고 내가 하는 건 아니지만 쨋든 너무 시간과 에너지가 아까웠다. 그래서 책 본문을 사진으로 찍으면 사진 속 글을 옮길 수 있는 프로그램을 이용하고자 한다. 1. 첫번째 생각한 방법 -> 빅스비 이용. 실제로 빅스비를 이용해 외국 가게 간판을 찍은 후 글자만 뽑아 번역해 식당에 간 적이 몇 번 있었기 때문에 제일 먼저 생각났다. 단점이 있다면 될때까지 찍어야 하고.. 빅스비의 글자 인식률은 뛰어나지만 빅스비에서 찍어서 글자 뽑음 -> 복사 -> 카톡, 윈도우 메모 등의 복사 수단을 이용하여 컴으로 옮김 -> 받은 후 다시 복사하여 한글 파일에 붙여넣기 과정이 필요한데.. 컴으로 옮기기까지의 자동화 방법을 전혀 모르겠다.. 그래서 ..
2020.04.23 -
데이터베이스 3주차 - 데이터베이스 시스템
1. 데이터베이스 시스템의 정의 데이터베이스 시스템 (DataBass System : DBS) 란 데이터베이스에 데이터를 저장하고, 저장된 데이터를 관리하여 조직에 필요한 정보를 생성해주는 시스템 사용자 데이터 언어 데이터베이스 관리 시스템 데이터베이스 데이터베이스 (DB)와 데이터베이스 관리 시스템 (DBMS), 데이터베이스 시스템(DBS)를 헷갈리기 쉽다 데이터베이스 = 저장된 데이터의 집합, 데이터베이스 관리 시스템 = 데이터베이스에 저장된 데이터를 유지 및 관리 데이터베이스 시스템 = 데이터베이스와 데이터베이스 관리 시스템을 이용해 조직에 필요한 정보를 제공해주는 전체 시스템 해당 표의 전체를 다루는 시스템이 데이터베이스 시스템이다. 2. 데이터베이스의 구조 2 - 1. 스키마 (= 메타 데이터)..
2019.10.29