박사과정을 졸업한 뒤 느낀점 (2)
1. 창업에 대한 도전 1
나는 학부생부터 창업과 스타트업에 대한 관심이 많았다. 연구에 대한 회의적인 생각이 들던 때와 겹쳐, 그동안 왜 나는 창업에 도전을 못해봤을까?란 생각이 들었다.
아직 어려서, 모르는 게 많고, 더 배워야 해서, 연구를 해야해서, 이런 저런 핑계를 대며 살아왔는데 영원히 못하게 될 것 같다는 생각이 들었고, 학생일 때 해야 최선일 거라는 생각과, 진짜 문제를 찾고 싶은 열망에 한다면 지금 당장 해보자, 결심을 하게 됐다.
마침 학교에서 UC Berkeley, 500 Startups과 함께하는 KOTRA-KAIST Silicon Valley Startup & Challenge Program 2020을 모집하고 있었고, 지원했다. (그 무렵 학교 근처에서 지낼 방을 구하고 있었는데, 하나 하나 직접 찾아가보기가 너무 귀찮고 번거로워서, 직접 가보지 않아도 그 방의 상태에 대해서 잘 알 수 있는 문제를 풀어보자고 생각했고, 당시 모바일 기기로서는 최초로 신형 아이패드에 LiDAR가 탑재되어 나왔고, 메타의 오큘러스가 출시됐으니, VR을 통해 방을 가상으로 가볼 수 있는 걸 만들어 보기로 했다. 곧, LiDAR가 모바일 기기의 카메라처럼 보편화 된다면, 저렴한 가격으로 방을 스캔하여 방을 중매하는 솔루션은 충분히 수요가 많은 기술일거라 생각했다.)
그리고 많은 창업 관련 책들에서 읽었듯이, 혼자 하면 빠르지만, 오래갈 수 없다는 철학과 함께 평소 창업에 관심이 많았던 친구 한 명을 꼬셔서 같이 프로그램을 나가게 됐다.
대략 4개월 정도 진행을 했던 것 같았는데, 학교의 지원 프로그램이 끝나고, 만드는 것은 잠시 멈추고, 직접 에어비앤비 사업을 하시는 분과 인터뷰를 하고, 고객을 만나보니, 우리가 타겟으로 했던 대학가 주변의 원룸은 방의 구조는 사실상 비슷했고, 주변 입지와 옵션, 가격이 더 중요하겠다는 생각이 들어서 잠시 멈추고, 다시 처음부터 고민을 해보기로 했다.
2. 창업에 대한 도전 2
2021년 새해가 되었고, 여러 가지 아이템을 검토하다가, 이번에는 학교에 있던 E*5 프로그램에 AI와 관련하여 AI 학습 데이터를 가상으로 만들어서, 학습 데이터에 대한 비용을 낮추는 아이템으로 도전을 하게 되었다. 많은 일들이 있었지만, 운이 좋게도 총 세 번의 평가에서 모두 1등의 성적으로 우승을 할 수 있었고, 좋은 투자 제의도 받아서, 이제 진짜로 법인을 만들고 달려나갈 준비를 해야하는지 고민했다. (투자를 받으면, 내 자의로 그만둘 수 없기에)
대회 우승과 사업의 성공은 완전히 다른 문제이기에, 지속적으로 시장 발굴을 해야했는데, 나는 진심인데, 진심인 것 같지 않은 공동창업자들과 뜻이 맞지 않았고, 갈등 상황에서, 내가 가진 대안은 모두 시도해봤으나 효과적이지 않았고, 나는 설득에 너무 지쳤다. 계속한다면 그들과 최소 5~7년을 함께 해야하는데, 그럴 수는 없겠다는 결론을 내렸다.
그럼에도 불구하고, 정말 진심으로 도전해봤고, 많이 고생했고, 많이 배웠다. 특히, 내가 연구실에서 앉아서 연구만 하면서 느꼈던 갈증을 풀 수 있는, 즉, 실제 산업계가 가지고 있는 문제에 대해서 고민하고, 고객들을 많이 만나보고, 솔루션을 만들어 볼 수 있는 아주 좋은 경험이었다.
그만 둔 뒤에, 내가 창업을 하고 싶었던 이유는 무엇일까, 내가 과정보다는 결과의 달콤한 부분을 생각하며 창업을 하고 싶었나라는 고민하며, 내가 과정도 즐길 수 있는 일은 무엇일까 돌이켜보기도 했다.
3. 인턴 생활
창업을 그만 둔 뒤에, 이제 연구를 다시 하여 졸업 준비를 해야했다. 내게는 두 가지 선택이 주어졌었다. 우리 연구실의 거의 모든 선배는 박사 2~3년차 때 런던을 가서 visiting scholar로 약 1년간 머무르며 해외에 계신 교수님과 공동 연구를 하고 졸업 준비를 하여 한국에 돌아와서 졸업을 하곤 했다. 나도 마찬가지로 런던을 갈 수 있는 기회가 있었지만, 2021년은 코로나 바이러스가 창궐하여 런던에서의 연구는 어려울 거라 생각했고, 나는 대신 3개월간 인턴을 가겠다고 교수님께 논의를 했다.
지난 창업의 경험에서 막상 회사를 운영해보려하니, 실제로 회사는 어떻게 굴러가는지, 어떻게 관리를 하고 관리가 되는지, 내가 너무 과한 것을 공동창업자들에게 요구한 것인지, 직원은 어느 정도로 일을 하는 건지, 기준점이 없으니 너무 어려웠고, 또 궁금했다. 큰 회사는 어떤 지도 궁금했지만, 작은 조직에서는 어떻게 성장해 나가는지도 궁금했다. 그렇게 2021년 말부터 인턴 생활을 시작하게 되었다.
3개월간 짧은 시간이었지만, 관심을 가지고 그 당시 학교 선배님이셨던 상무님께 많이 물어보고 많이 배울 수 있었던 값진 시간이었다. 또한 내가 인턴한 회사에서도 AI에 대해서 데이터가 부족하고, 제품은 항상 자원(컴퓨팅, 메모리)이 부족하다는 것을 볼 수 있었다.
사업에서 이 회사는 전략적으로 왜 이런 선택을 하는 것인 지, 회사가 어떻게 굴러가고 관리가 되고 있는 지에 대해서는 모두 이해하기에는 어려운 시간이었지만, 통념으로 알고 있었던 사실 (꽤 많은 사람들은 그냥 주어진 업무를 하면서 회사를 다니는구나)을 직접 체험해 볼 수 있었던 것 같다.
4. 대학원으로의 복귀
2021년 하반기부터 2022년 초까지의 창업과 인턴 생활을 마치고 다시 연구에 전념하기 위해 연구실로 복귀했다. 벌써 박사 4년차가 돼버렸고, 졸업을 준비해야겠다는 생각에 급하게 박사 논문 주제를 무엇으로 해야할 지 고민했다.
기존에 박사 1,2 년차 때 했던 주제로 디펜스(졸업심사)를 한다면, 논문을 쓰기 위한 연구를 했다고 생각했기에, 좋은 문제를 풀었다고 할 수 없었고, 한 분야의 전문가가 된 기분도, 수학능력을 길렀다는 느낌도 얻을 수 없을 것 같아, 박사를 따더라도 스스로 자랑스러울 수 없을 것 같았다.
그래서 이번에는, 어떤 연구를 할 떄에, 그 연구(논문)이 세상에 없어서 풀고 그 가치가 무엇인지 찾아보는 top-down 방식 대신, 창업을 통해 많이 고민하고 학습했던 문제 정의부터 시작하여, 실제로 주어진 문제를 기반으로, 독창적인 solution을 제안하는 bottom-up 방식으로 박사 학위 논문을 작성해보자고 생각했다. 솔루션을 문제에 끼워맞추는 방식은 문제가 가치 있는 문제가 아닌 경우가 발생하고 무슨 문제인지를 정확히 파악이 어려워 동기부여도 떨어뜨리는 반면, 문제가 무엇인지 파악하고 문제에 적합한 솔루션을 고안하는 것이 더 가치있고 적절하며 지속 가능한 문제 해결방식이라 생각했다.
그 때 정의한 문제는, 창업과 인턴 생활로 직접 문제가 있다는 걸 확인한 문제 즉, 부족한 학습 데이터와, 부족한 학습/추론 자원 (컴퓨팅, 메모리 등)에서도 좋은 AI 모델을 학습하는 방법
에 대해 고민하기 시작했다.
문제를 정의했기에, 다양한 방법 중 하나로 접근한 것은, crowd learning이라는 새로운 패러다임을 제시하는 거 였다. 내가 초기에 설정한 crowd learning이라는 패러다임은 AI를 data plane과 computing plane, algorithm plane으로 아래처럼 나누었다.
- Crowd Data plane: crowd (사용자들)에게 분산되어 있는 학습 data를 잘 학습에 활용할 수 있도록 하는 방법과,
- Crowd Computing plane: 학습에 필요로하는 GPU와 같은 컴퓨팅 자원 또한 효율적으로 crowd로 부터 빌려 활용할 수 있는 방법,
- Crowd Algorithm plane: 실제 활용하고자 하는 crowd의 부족한 requirement(e.g., 메모리, 컴퓨팅 등)에 맞는 다양한 성능의 model들을 찾아내는 방법 Crowd learning은 위와 같은 세 가지 기능을 할 수 있는 프레임워크였다.
이를 위해서, 우리가 클라우드 서비스 (e.g., AWS)를 활용하면, 활용한 만큼 금액을 제공하는 것처럼, crowd에게 기여한 만큼 incentive(보상)를 제공하여 data와 computing 자원을 빌려써서 algorithm (model)을 집단 지성으로 찾아내어 모델을 학습할 수 있도록 하는 것이었다.
위를 구현하기 위해서 필요한 기술들을 narrow-down하여 세세하게,
- 사용자가 데이터를 공유하는 방법 (public하게 할 것인지, labeling 등 데이터 가공은 어떻게 할 것인지),
- 공유된 데이터 중 어떤 것이 좋은 데이터인지 판단하는 방법과 그에 맞는 보상을 제공하는 방법,
- 분산된 컴퓨팅 자원을 효율적이게 분산적으로 활용하는 방법,
- 실제로 컴퓨팅 자원을 제공했다는 것을 확인하는 방법,
- 여러 가지 requirement에 맞는 다양한 모델을 효율적으로 학습하는 방법 등으로 나눌 수 있었다.
다음글에 이어서…