본문 바로가기

Dev. IT 동향

국내 기업들도 ‘오픈소스’로… 활동 본격화


글로벌 IT 기업들이 자사 기술을 공개하고 오픈소스화 하는 일은 이제 새롭지 않은 일이 됐다. 오픈소스 소프트웨어를 쓰기만 하고 기여하지 않는다는 비판을 받아온 국내에서도 오픈소스 프로젝트에 적극적으로 기여하는 모습이 조금씩 나타나고 있다. 주도적으로 오픈소스 활동을 벌이고 있는 이들을 만나 국내 오픈소스 분야의 변화와 과제를 살펴봤다.

 

사티아 나델라 마이크로소프트(MS) 최고경영자(CEO)는 2014년 10월에 열린 미디어 행사에서 “MS는 리눅스를 사랑한다”고 말했다.

실제로 리눅스의 적이었던 MS는 여러 제품이 리눅스와 연결될 수 있도록 지원하기 시작했다. 그 중 일부는 오픈소스로 전환하기까지 했다. 이렇게 오픈소스를 중시하는 방향으로의 변화는 특별한 일이 아니다. 주요 IT 기업들이 앞 다퉈 오픈소스에 동참하고 있기 때문이다.

송상효 한국공개소프트웨어협회장은 “기업의 소프트웨어(SW) 연구개발 한계가 오픈소스를 활용하는 가장 큰 이유”라고 말했다.

개발속도 높여주고 SW교과서 역할도
오픈소스의 개발속도가 기업 내 개발속도보다 더 빠르다는 것이다. 예를 들어 사물인터넷(IoT) 같은 경우 네트워크, 디바이스, 센서 등 여러 영역에서 개발이 필요한데 이를 한 기업이 감당하기는 쉽지 않다고 설명했다.

송 회장은 또 “SW의 규모가 커지고 복잡해진 점도 오픈소스 활용이 늘어난 이유”라고 말했다.

SW 개발의 난이도가 높아진 만큼 IT기업들이 요소기술에는 오픈소스를 활용하고 제품과 서비스 개발에 집중해 경쟁력을 확보하는 것이다. 그래서 오픈소스는 상용SW를 대체하는 역할보다는 개발에 활용되는 ‘소스’로서 역할이 더 크다.

오픈소스는 SW 인력 양성에도 도움이 된다. 송 회장은 SW를 영어에 비유했다. 영어를 공부하고 잘 활용하기 위해 많은 예문을 보고 배운다. SW도 많은 코드를 보고 배워야만 한다. 이때 오픈소스는 코드가 공개된 일종의 실전 예제다. 과거에는 SW 공급자들이 교육을 위한 툴을 제공했지만 단지 사용법을 익히기 위한 것이었다. 원천기술을 배우기 위해서는 소스를 보고 분석해야 하는데 오픈소스는 좋은 교과서가 된다.

그렇다고 오픈소스가 장점만 가진 것은 아니다.

송 회장은 “오픈소스는 많이 쓰이는 소스가 끝까지 살아남는 야생의 세계”라며 “트렌드를 잘 읽어야 한다”고 지적했다. 오픈소스는 좋은 것이 아니라 많이 쓰이는 것이 살아남는 만큼 처음 사용할 때 잘 선택해야 한다는 것이다. 오픈스택이 대표적인 예다. 클라우드 컴퓨팅을 위한 오픈소스 프로젝트인 오픈스택은 시작은 늦었지만 많은 사람이 참여하면서 개발이 활발해지고 결국 중요한 오픈소스로 자리 잡았다.

송 회장은 우리나라의 경우 활용은 잘 하지만 오픈소스 생태계를 만들지 못하는 것이 문제라고 지적했다. 또 “오픈소스는 활용을 하면 기여도 해야 한다”며 “커뮤니티와 기업 후원이 있어야 오픈소스 생태계가 생겨난다”고 강조했다.

오픈소스 활용에서 기여로 나가기 위해서는 커뮤니티가 필요한데 기업 후원이 필수라는 말이었다. 하지만 우리나라는 기업의 커뮤니티 후원이 미미해 생태계의 선순환 구조가 만들어지지 않는다고 설명했다. 그래도 최근 우리나라에서도 오픈소스에 기여하는 사례가 나타나고 있다.

특히 아파치 SW 재단의 지원을 받는 프로젝트를 한국 개발자가 주도하는 사례가 늘었다. 그루터 개발자들이 주도하고 있는 ‘타조(TAJO)’를 비롯해, 카카오가 의욕적으로 공개한 그래프 데이터베이스인 ‘S2Graph’, 삼성전자와 라인의 개발자 등이 주도하고 있는 딥러닝 분산 플랫폼 ‘혼(HORN)’ 등이 대표적이다.
 

타조(TAJO)
아파치 타조는 하둡 기반 데이터웨어하우스 시스템으로 그루터의 최현식 박사와 손지훈 박사가 대학원에서 시작한 프로젝트다. 2013년 3월 아파치재단 인큐베이팅 프로젝트에 선정된 후 1년 만에 아파치 톱 프로젝트로 승격됐다. 타조는 하둡분산파일시스템에서 SQL언어를 사용할 수 있게 해준다. 기존 관계형 데이터베이스 시스템에서 널리 활용되는 SQL언어를 하둡에서도 사용할 수 있게 해주는 만큼 하둡 활용성을 높이는데 필수적인 시스템이다. 또 하둡의 맵리듀스를 사용하지 않기 때문에 실시간으로 데이터를 이용할 수 있다는 장점도 있다.

그루터는 타조와 밀접한 관련을 가진 기업이다. 프로젝트를 시작한 최현식 박사와 손지훈 박사를 비롯해 총 8명의 직원이 아파치 타조 개발에 참여하고 있다.

권영길 그루터 대표는 “회사 차원에서 타조의 개발에 직접 관여하지 않는다”면서도 “그루터 개발자들이 타조 개발에 깊이 관여하는 만큼 타조를 가장 잘 이해하고 있다”고 설명했다.

오픈소스인 타조를 가장 잘 이해하고 있다는 점이 그루터의 중요한 비즈니스 모델이다. 하둡은 누구나 활용할 수 있지만 하둡을 활용하는 과정에서 전문가가 필요할 때 필요한 서비스를 제공할 수 있다는 것이다.

그런데 국내는 시스템통합(SI) 중심이어서 SW 기술에 대한 대우가 낮은 것이 오픈소스를 활용한 비즈니스에 걸림돌이 된다는지적이다.

그루터는 올해 비즈니스의 중심을 미국으로 옮겨갈 계획이다. 오픈소스를 활용한 전문가 비즈니스는 국내 시장이 작아 글로벌 진출이 필수이기 때문이다. 비즈니스의 강조점도 하둡에서 분산시스템으로 확대하고 있다.

권 대표는 “지금까지 타조는 ‘SQL온하둡’으로 하둡에서 활용할 수 있다는 점을 강조했지만 핵심은 하둡이 사용하는 분산파일시스템에서 SQL을 사용할 수 있게 하는 것”이라며 “분산파일시스템을 사용하는 시스템이면 하둡이 아니라도 어디든지 사용할 수 있다”고 설명했다.

S2Graph
S2Graph는 분산그래프 데이터베이스(DB)다. 데이터를 상관관계에 따라 그래프 형태로 저장하는 DB다. 카카오의 여러 서비스에서 발생하는 데이터는 한 곳에 저장된다. S2Graph를 이용해 저장된 데이터를 실시간으로 특정 사용자와 관계가 있는 인물과 활동으로 정리한다. 예를 들어 사용자에게 음악을 추천하는 서비스에서는 사용자가 좋아할 만한 음악을 추측하기 위해 사용자의 친구들과 그들이 즐겨듣는 음악을 확인하는데 사용할 수 있다.

개발은 윤도영 카카오 그래프DB 파트장이 주도했다.

윤 파트장은 “데이터마이닝을 하면서 서비스 개발자로부터 특정 사용자의 친구 관계를 확인하고 친구가 뭐하는지 확인해달라는 요청을 너무 많이 받았다”며 “반복적인 일을 쉽게 하면서도 동시에 여러 요청을 처리할 수 있는 단단한 DB가 필요했다”고 설명했다.

2014년 9월 윤 파트장이 개인적으로 개발을 시작해 2015년 1월 카카오에 공식 적용되기 시작했다. 2015년 11월에는 공식적으로 아파치 인큐베이팅 프로젝트에 포함됐다. 현재 카카오에서는 8명이 S2Graph와 관련된 일을 하고 있다.

카카오 같은 서비스 회사에서 데이터 저장소를 오픈소스로 공개하는 것은 기업의 가장 중요한 코어를 공개하는 것과 같다. 사용자 데이터를 실시간으로 빠르고 정확하게 분석해 제대로 된 추천 결과를 보여주는 것이 서비스의 성패를 좌우하기 때문이다. 페이스북의 경우 같은 기술을 논문으로는 발표했지만 오픈소스로 공개하지는 않았다.

카카오 측은 “카카오 같은 성공한 기업이 사회에 기여하는 방식 중 하나”라며 “전체 기술이나 시장을 키우는 것이 궁극적으로 산업을 발전시키는데 도움이 될 것으로 생각한다”고 설명했다.

윤 파트장은 “소스공개는 상생에 기여한다는 의미와 함께 외부에 기술력을 알리는 효과도 있다”며 “카카오는 서비스 회사이기 때문에 소스를 공개하는 것과 별도로 차별화된 서비스를 만들면 된다”고 말했다.

그는 오히려 “우리나라에서는 회사의 핵심적인 부분을 공개하고 참여를 유도해도 여전히 참여를 꺼린다”며 오픈소스 사용에 편향된 개발 문화를 지적했다.

윤 파트장은 또 “오픈소스를 사용할 때 발생하는 버그를 알려주는 것도 오픈소스를 향상시키는 데 기여하는 것”이라며 “오픈소스를 어렵게 생각하지 않는 문화가 필요하다”고 덧붙였다.

혼(HORN)
아파치 혼은 딥러닝 분산 플랫폼이다. 딥러닝은 최근 가장 주목받는 인공지능 기술이다. 딥러닝 기술은 많은 데이터와 강력한 컴퓨터 능력을 바탕으로 컴퓨터 활용성을 높이고 있다. 하지만 컴퓨터 전공자라도 인공지능이나 유사 분야에 대한 지식이 없으면 딥러닝을 활용하기 어렵다. 혼은 딥러닝을 더 쉽게 사용할 수 있게 하는 것을 목표로 한다.

문제는 최근 구글에서 인공지능 머신러닝 엔진 ‘텐서플로’를 오픈소스로 공개했다는 점이다. 가장 뛰어난 인공지능 기술이 오픈소스로 공개되면서 혼의 가치가 줄어든 것이다. 하지만 프로젝트를 제안하고 이끌고 있는 윤진석 개발자는 “혼은 데이터 분산 시스템과 인공신경망 모델을 모두 사용한다는 점에서 여전히 의미가 있다”고 설명했다.

텐서플로는 모바일에서 사용하기 쉽게 만들어져 다량의 데이터를 저장하고 있는 데이터 분산 시스템을 이용하기 어렵다. 반면 혼은 아주 큰 규모의 분산 시스템에도 대응할 수 있다는 것이다. 또 텐서플로는 행렬 기반의 컴퓨팅 모델을 사용하는 반면 혼은 인공신경망 모델을 활용해 학습능력과 계산능력이 더 뛰어나다고 설명했다. 특히 윤 개발자는 “지금까지 나온 딥러닝 오픈 소스들은 데이터 분산과 인공신경망 모델을 모두 적용하지 못하지만 혼은 가능하다”고 강조했다.

2015년 10월 아파치 인큐베이팅 프로젝트에 들어간 혼은 삼성전자에서 일하는 윤진석 개발자를 비롯해 네이버라인, 루닛 등 국내 여러 기업의 개발자들에 의해 주도되고 있다. 프로젝트를 처음 제안한 윤진석 개발자는 삼성전자에서 풀타임 오픈소스 개발자로 일하고 있다.

윤 개발자는 “한국에서 삼성전자를 제외하면 풀타임으로 오픈소스 개발에 전념하는 사람을 찾기는 어려울 것”이라며 “한국의 오픈소스 커뮤니티를 활성화하고 SW 기술을 발전시키기 위해서는 기업들이 오픈소스 개발자들을 더욱 지원해야 한다”고 말했다.

<본 기사는 테크M 제34호(2016년2월) 기사입니다>