Go 언어에서 음성인식 API 사용하기
이번 튜토리얼에서는 Go 언어로 일반 STT 방식과 스트리밍 STT 방식의 예제 코드를 API를 사용한 경우와 SDK를 사용한 2가지 방식으로 보여줍니다.
이번 튜토리얼에서는 Go 언어로 일반 STT 방식과 스트리밍 STT 방식의 예제 코드를 API를 사용한 경우와 SDK를 사용한 2가지 방식으로 보여줍니다.
리턴제로 STT API는 스트리밍 기능을 지원하여, 녹음된 파일 뿐만 아니라 실시간 음성을 자막으로 만들 수 있습니다. PC에서 출력되는 소리를 실시간으로 자막으로 만들어보며, 스트리밍 STT 사용법에 대한 튜토리얼을 소개하겠습니다.
이번 튜토리얼에서는 리턴제로의 빠르고 성능 좋은 STT API와 파이썬만으로 백엔드와 프론트엔드에 대해서 잘 모르는 분들도 쉽게 구현할 수 있는 웹앱을 만들어봅니다.
by Troye 이번 튜토리얼에서는 Triton Inference Server에 요청하기 위해 필요한 복잡한 과정을 크게 줄인 리턴제로의 Tritony 라이브러리를 소개하겠습니다. 또 기본
리턴제로의 음성인식 API에는 음성파일을 한 번에 텍스트로 변환하는 일반 STT와 음성파일을 쪼개어 실시간으로 변환하는 스트리밍 STT가 있습니다. 스트리밍 STT의 방식에서 gRPC를 사용한 Tutorial을 소개합니다. Mac의 마이크를 사용한 예제로 제공합니다
리턴제로의 음성인식 API에는 음성파일을 한 번에 텍스트로 변환하는 일반 STT와 음성파일을 쪼개어 실시간으로 변환하는 스트리밍 STT가 있습니다. 스트리밍 STT의 방식에서 gRPC를 사용한 Tutorial을 소개합니다
이번 Tutorial에서는 VITO API 를 이용해 음성 데이터를 텍스트로 변환해보고 결과가 얼마나 정확한지 확인해봅니다. 또한, 측정한 성능이 STT 시장에서 어느 정도의 수준인지 확인합니다.
VITO의 STT API는 다양한 언어에서 쉽게 접근하고 활용할 수 있는 특징을 가지고 있습니다. 공식 문서에서는 주로 Java, Curl, Python 등을 통해 API의 사용 방법을 안내하고 있습니다. 하지만 이번에는 조금 다른 방법으로, Typescript를 이용하여 React.js와 Node.js에서 일반 STT API를 적용해보는 튜토리얼을 준비했습니다.