[기획] 텍스트 추출기 앱 설계
텍스트 추출기 앱 기획
서론
Planner 앱 출시 이후, 군대 가기 전에 앱 하나 더 출시하고 가자는 생각에 아이디어를 몰색하다가 텍스트 추출기 앱을 떠올리게 되었다.
이번 포스팅에서는 텍스트 추출기 앱을 떠올리게 된 아이디어와 어떤 기능을 담을 건지 간단하게 작성해보고자 한다.
아이디어 선정
전부터 웹소설을 보던 것을 즐겼었다.
웹소설 플랫폼은 네트워크가 안 통하는 지역에서는 사용이 불가하기 때문에 텍스트로 따 저장하는 텍본이라는 방식으로 웹소설을 즐기는 사람이 많다.
텍본으로 자신이 재미있게 본 웹소설을 저장하려고 만드는 사람들도 많다.
나도 내가 재미있게 본 웹소설들을 텍본으로 만들고 싶었다.
pc에서 하는 방법은 많이 나와 있었지만, 모바일에서 하는 방법은 많이 나와있지 않았다.
그래서 OCR(광학 문자 인식) 서비스를 활용한 텍스트 추출기 앱을 만들고자 앱 아이디어를 떠올리게 되었다.
구현할 기능
- 사용자가 직접 캡처한 이미지들을 앱에 불러온다.
- 불러온 이미지들의 텍스트를 모두 추출해 문자열로 저장한다.
- 저장된 문자열을 마음껏 수정 가능하게 한다.
- 수정된 문자열은 txt 파일로 저장한다(사용자의 기기 안에 저장된다).
- 저장 후 사용한 이미지는 삭제될 수 있도록 한다.
- 기존의 txt들을 합쳐서 하나의 txt파일로 재저장한다(합치고 나서 2번 아래의 과정을 진행할 수 있다).
- 인 앱 광고를 넣을 예정이다(아래는 기획 중인 광고 위치).
- 이미지 안의 텍스트를 추출 중일 때 로딩 화면
- 앱 하단
사용할 기술
사용자 앱의 파일 정보를 불러와야 하기 때문에 저장소 권한을 이용해 파일 정보를 가져와야 할 듯하다.
Android 11(Android Q) 버전 이상부터 저장소 권한이 세부적으로 변한다는 것은 알고 있어서 처리가 귀찮아질 것 같다.
일단 compose에 mvi 아키텍처 기반으로 프로젝트를 진행할 예정이다.
가장 중요한 텍스트 추출 서비스는 firebase에서 제공하는 google vision ocr api를 사용할 예정이다.
다양한 ocr 서비스가 있지만 무료 서비스들은 문자(특히 한글) 인식률이 좋지 않아서 한글 인식이 좋고 가성비가 있는 google vision을 선택했다.
google vision과 다른 유료 ocr 라이브러리의 요금 구조
- google vision: 1건당 0.0015달러(매달 1000건 무료), 초과 시 1000건당 1.5달러
- naver clova: 1건당 3원(매달 300건 무료)
- upstage: 1건당 3원
- azure document intelligence: 1건당 0.01달러(매달 500건 무료)
다른 ocr 서비스에 비해 google vision이 압도적인 가성비를 자랑한다.
naver clova가 성능이 더 좋다고 하는데 내 생각에는 naver clova만큼 고성능의 ocr이 필요하지 않다고 생각했다.
사실 가격이 너무 비싸서 앱을 출시하게 되면 적자가 날 것 같아서 빠르게 포기했다..
기술 목록
- compose
- mvi
- google vision ocr api
일단 생각나는 것이 이거밖에 없어서 추가로 적진 않겠다.
데이터베이스가 필요하게 되면 supabase를 공부해서 사용해 볼 생각은 있다.
효과
사용자들이 이 앱을 사용하면서 자신이 웹소설 플랫폼에서 캡처한 이미지를 통해 웹소설 텍본을 모바일 환경에서 제작할 수 있게 해서 pc 없이도 텍본을 만들 수 있게 될 것이다.
이미지를 일일이 넣는 게 고생이지만 pc를 사용할 수 없는 환경에서 텍본을 제작할 수 있게 될 것이다.
정리
이번에 새로 만들 예정인 서비스 기획을 남겨보았다.
내가 처음 접하는 기술들은 현재 검증 진행 중이다.
기술 검증에 관련한 포스팅도 조만간 1개 올릴 예정이다.
개발 기간은 1달 정도로 잡을 예정이고 이번에는 삐끗하지 않고 한 번에 출시가 되었으면 좋겠다.