One-cloud DC/OS на Java и для Java
День 1 / 18:30 / Зал 4 / Язык: RUОдноклассники состоят из более чем восьми тысяч железных серверов, расположенных в нескольких дата-центрах. Каждая из этих машин была специализированной под конкретную задачу (как для обеспечения изоляции отказов, так и для обеспечения автоматизированного управления инфраструктурой).
В определённый момент стало понятно, что внедрение новой системы управления позволит более эффективно загрузить технику, облегчить управление доступами, автоматизировать (пере)распределение вычислительных ресурсов, ускорить запуск новых сервисов, ускорить реакции на масштабные аварии.
Новая система должна объединять под своим управлением все сервера Одноклассников, что, с одной стороны, делает её самой крупной и критичной распределённой системой, а с другой, выдвигает жёсткие требования по обеспечению надёжности её правильного функционирования в любый условиях — особенно при возникновении масштабных отказов и аварий. Это потребовало как тщательного планирования отказоустойчивости, так и особых архитектурных решений.
В данном докладе будет рассказано как о интересных деталях устройства one-cloud, так и об опыте Одноклассников по эксплуатации высоконагруженных Java-приложений в контейнерах.
Олег Анастасьев, Одноклассники
Начал карьеру программиста в далеком 1995 году. Разрабатывал ПО в банковской сфере, телекоме, транспорте. Работает ведущим разработчиком в Одноклассниках с 2007 года в команде платформы. В его обязанности входит разработка архитектур и решений для высоконагруженных систем, больших хранилищ данных, решение проблем производительности и надежности портала. Также занимается обучением разработчиков внутри компании.