Перейти к содержимому

Донат
На хостинг
ISK за переводы
до 75kk за 1000зн.
Хроники EVE
Сборник
Новичкам
Полезная информация
Фотография

Информация о ходе работ: Возвращение спокойствия на Транквилити


  • Авторизуйтесь для ответа в теме
36 ответов в теме

#1
JMerchant

JMerchant

    Clone Grade Beta

  • Tech III Pilots
  • Pip
  • 66 сообщений
102
  • EVE Ingame:JMerchant
  • Client:Eng
Информация о ходе работ: Возвращение спокойствия на Транквилити
("Progress update: restoring tranquility to tranquility")

Оригинал: http://www.eveonline...?a=blog&bid=737 от CCP Valar:

Начиная с 25 ноября 2009 года, за несколько дней до установки Доминиона, мы переживали частые незапланированные перезагрузки Транквилити. Почти все из них случались из-за бага в сетевой подсистеме, который вызывал отказ SQL-сервера.

Почему же - почему, и что Вы с этим всем делаете?

Как только случился первый отказ, мы согласно нашей стратегии, открыли прецедент для тех.поддержки поставщика относительно инцидента, т.к. наши логи, к удивлению, ничего не показали. Их ответ был следующим: проблема была вызвана состязанием сигналов в системе*.

Мы плотно поработали с тех.поддержкой поставщика, и группы разработки в попытке исключить этот баг собрали громаднейшее количество диагностических данных и применили изменения, которые рассматривались поставщиком, как потенциальные решения. Мы верим, что мы нашли путь обхода, при котором баг будет запускаться с малой вероятностью, но не предотвратили его появление на 100%. Однако это еще надо подтвердить.

Как все могут себе представить, трудно диагностировать такую действующую высокопроизводительную среду, как наша, без вызова лагов или других проявлений, или проблем с надежностью. Поставщик усердно работал, стараясь воспроизвести этот случай в своей лаборатории, хотя сбор диагностических данных с похожих систем ставил важнейшую задачу: сделать это без негативного воздействия на уровень производительности в восприятии клиентов.

У нас, всё же, есть программисты и системные администраторы виртуального мира, которые работают над сбором тестового скрипта ,чтобы запустить его на сервере БД, который мы используем для Singularity и Multiplicity, и если у нас получится воспроизвести этот случай там, мы сможем предоставить поставщику код, который воспроизведет проблему в их лаборатории.

Я персонально потратил достаточно большую часть рабочего времени за последние 3 месяца, общаясь напрямую с поставщиком, собирая диагностические данные, настраивая инструменты сбора и работая над вещами, связанными с решением проблем SQL-сервера.

Короче говоря, мы используем все ресурсы, которые есть в нашем распоряжении, чтобы решить проблему. Это высокоприоритетная проблема для всех наших групп, вовлеченных, т.к. это воздействует не только на наши системы и клиентов, но также может воздействовать и на огромные системы и пользовательские базы, использующие схожие сетевые решения и решения для баз данных.

Что мы уже сделали? Что мы уже знаем?

Мы знаем, что проблема кроется в стеке TCP, и, похоже, что надо что-то сделать с управлением закрытыми сокетами или их закрытием. Наш поставщик попросил нас применить некоторые потенциальные исправления и пути обхода. Мы отрегулировали некоторые сетевые особенности и проапгрейдили движок SQL-сервера до той версии, где есть пути обхода для случаев подобной природы. Манипулятор баз данных в серверном приложении EVE использует сеансовый пул, и мы уже экспериментировали с различными настройками в нем. Выключение переработки подвисших сессий кажется многообещающим как обходной путь, делающий запуск бага менее вероятным.

Мы все еще работаем над исправлением, как я уже сказал, и, кажется, мы сможем сделать отказы менее частыми с последними изменениями. Ждите новых объявлений о прогрессе в этом направлении в ближайшем будущем.

- CCP Valar



* состязание сигналов – это проблема возникающая, как в электронике, так и в сетевых технологиях, и в программном обеспечении. Русская вики дает скромное описание, но зато пару полезных ссылок. Английская вики описывает более подробно: Race condition.

Вчера на сингулярити опять был большой тест… Возможно, CCP что-то и смогло найти.
  • 1

#2
antonn*Нейтрал

antonn*Нейтрал
  • Guests
"поставщик" - вендор, речь об MS?
  • 0

#3
Dreamwalker

Dreamwalker

    Clone Grade Eta

  • Tech III Pilots
  • PipPipPipPip
  • 827 сообщений
85
  • EVE Ingame:Caine Dreamwalker
  • Channel:Mozg
  • Client:Eng

"поставщик" - вендор, речь об MS?

Не исключено, что MS интересна работа их сервера в таком нагруженном режиме :)
  • 0
There's nothing really damn stupid that humans won't do © Terry Pratchett

#4
alex_zlobin

alex_zlobin

    Clone Grade Gamma

  • Tech III Pilots
  • PipPip
  • 105 сообщений
16
  • EVE Ingame:MEHTOP
  • Client:Eng

"поставщик" - вендор, речь об MS?

Йесс, SQL-то у ССР от МайкроСофта.
  • 0

Эх, не того купил Псих и заслал в ААА. Нада было не Меха а СЕО РАТ ВГВ покупать. Он сцуко продажный, легко бы за 30 серебренников, упс лярдов легко бы всех покикал и слил бы кап флот ААА


#5
antonn*Нейтрал

antonn*Нейтрал
  • Guests
провайдер в какой-то мере тоже поставщик, потому и спрашивал, они мучали сеть или базу :)

Dreamwalker я бы даже сказал, что кроме них лучше о работе их базы никто не знает :blush:
  • 0

#6
JMerchant

JMerchant

    Clone Grade Beta

  • Tech III Pilots
  • Pip
  • 66 сообщений
102
  • EVE Ingame:JMerchant
  • Client:Eng

"поставщик" - вендор, речь об MS?

99%, что это они...
Неосведомленные читатели только гадают, в чем проблема: в MS SQL (сессии) или MS Windows (TCP, сокеты).

/offtop
Странно, что до сих пор нет высказываний типа "MS - отстой, вот если бы они использовали DB2/Oracle/Postgre/... !!".
/offtop

  • 0

#7
Fandanguero

Fandanguero

    Megatroll Navy Issue

  • Tech III Pilots
  • PipPipPipPipPipPip
  • 5119 сообщений
228
  • EVE Ingame:Fandanguero
  • Corp:I.N.
  • Channel:Ухотнеги рядам
  • Client:Eng
MS - форева! О:
  • 0

whQ6XJu.png


#8
antonn*Нейтрал

antonn*Нейтрал
  • Guests

/offtop
Странно, что до сих пор нет высказываний типа "MS - отстой, вот если бы они использовали DB2/Oracle/Postgre/... !!".
/offtop

в статье нет конкретики, водичка, как бы написано много, но ни о чем, потому все затаились :)
  • 0

#9
norfolk_s3d

norfolk_s3d

    Clone Grade Zeta

  • Tech III Pilots
  • PipPipPip
  • 477 сообщений
46
  • EVE Ingame:norfolkEG
  • Corp:0ne Man Army
  • Channel:t2y
  • Client:Eng

Короче говоря, мы используем все ресурсы, которые есть в нашем распоряжении, чтобы решить проблему.

МНЕ НЕ НУЖНЫ ВАШИ ОПРАВДАНИЯ (с)
  • 1

#10
Dreamwalker

Dreamwalker

    Clone Grade Eta

  • Tech III Pilots
  • PipPipPipPip
  • 827 сообщений
85
  • EVE Ingame:Caine Dreamwalker
  • Channel:Mozg
  • Client:Eng

Dreamwalker я бы даже сказал, что кроме них лучше о работе их базы никто не знает :)

Я к тому, что сложно создать тестовые условия, воспроизводящие работу сервера Евы) Соответственно для MS это может быть и возможностью для нахождения узких мест сервера.

А что, от того, что много людей будут орать "MSSQL - гуано, юзайте Oracle", CCP на него перейдут, да? :)
  • 0
There's nothing really damn stupid that humans won't do © Terry Pratchett

#11
MOH

MOH

    Военкор

  • Tech III Pilots
  • PipPipPipPipPipPipPipPip
  • 7904 сообщений
373
  • EVE Ingame:BOEHKOP
  • EVE Alt:Много разных
  • Corp:-TER-
  • Channel:TERMINOUT
  • Client:Eng

Мы знаем, что проблема кроется в стеке TCP,


До. Ага, как-же, в стеке.

- Почему разводишся с Сарой?
- Она меня сексуально не удовлетворяет.
- Странно, весь квартал удовлетворяет....

В головах у них проблема.

и, похоже, что надо что-то сделать с управлением закрытыми сокетами или их закрытием.

Стивенса почитать например. Вдумчиво.

Сообщение отредактировал MOH: 04 March 2010 - 17:39

  • 0
Пишу подробный политобзор в соотв разделе, а то они уже 5й год разобратся не могут, у кого яйца из льда, а у кого из стали, бренчат то одинаково. (С) Artsnis

#12
J Malkavian

J Malkavian

    Clone Grade Eta

  • Tech III Pilots
  • PipPipPipPip
  • 807 сообщений
80
  • EVE Ingame:J Malkavian
  • Corp:-GRD-
  • Ally:SOLAR FLEET
  • Client:Eng
я не понял, это они про лаги в зарубах при локале > 200/300?
  • 0
Изображение
И. Сталин: "Я дрался на боевом треножнике

#13
JMerchant

JMerchant

    Clone Grade Beta

  • Tech III Pilots
  • Pip
  • 66 сообщений
102
  • EVE Ingame:JMerchant
  • Client:Eng

я не понял, это они про лаги в зарубах при локале > 200/300?

Неее.. Лаги лагами, а это еще один случай. Периодически весь кластер перезагружается... Я один раз попадал на незапланированный ДТ, хотя и мало играю - так что, очевидно, проблема есть.
  • 0

#14
Trimutius III

Trimutius III

    Khanid Trader

  • Tech III Pilots
  • PipPipPipPipPipPipPip
  • 6685 сообщений
224
  • EVE Ingame:Trimutius III
  • EVE Alt:Weldy StarFiner
  • Corp:F-053
  • Channel:ru-help
  • Client:Eng

я не понял, это они про лаги в зарубах при локале > 200/300?

Про падения серва... Ты почитай темку:
http://forum.eve-ru....i...&start=2220

Последние несколько страниц (а то и пару десятков) Вот об этом речь...
  • 0
Я посланник из ниоткуда в никуда. Никто и ничто не посылало меня. И хотя это невозможно, я всё-таки существую. ©Тримутиус
Изображение

#15
gobobo

gobobo

    Публикую цитаты. И только.

  • Tech III Pilots
  • PipPipPipPipPipPipPipPipPip
  • 12622 сообщений
205
  • EVE Ingame:Terrytory
  • Corp:SDG
  • Client:Eng
Херога, лучше бы лаги убрали!
  • 0
Fuck IT. Just a game.

#16
Rainbow Hunter

Rainbow Hunter

    Дежурный по зоопарку

  • EVE-RU Team
  • 4778 сообщений
875
  • EVE Ingame:Rainbow Hunter
  • DUST Ingame:test
  • Corp:OMNYX
  • Client:Eng
В телефонных сетях есть подобные проблемы, когда например телефон тупо не работает и начинает работать только после отключения и в ключения к линии, это касается только электронных аппаратов. И возникает крайне редко. А тут БД и кластер, я вообще хрен знает как они там залипание искать будут.
  • 0
Изображение
Травля. RMT. Разведение троллей. Пособничество игровой коррупции.

#17
Bahus2

Bahus2

    Clone Grade Gamma

  • Tech III Pilots
  • PipPip
  • 99 сообщений
0
  • EVE Ingame:Velt Lhasar
  • EVE Alt:many more...
  • Corp:в свободном плавании
  • Client:Eng
Насколько я знаю Май спейс на MSsql, а нагрузки и трафик там на несколько порядков выше
  • 0

#18
Gwin

Gwin

    Clone Grade Omicron

  • Tech III Pilots
  • PipPipPipPipPipPipPipPipPipPip
  • 30348 сообщений
12703
  • EVE Ingame:Farma Son
  • Corp:DRUNG
  • Client:Eng

Насколько я знаю Май спейс на MSsql, а нагрузки и трафик там на несколько порядков выше



База Евы тоже на MS SQL и что?
Насчёт нагрузок - сильно не уверен. :)
  • 0

#19
Trimutius III

Trimutius III

    Khanid Trader

  • Tech III Pilots
  • PipPipPipPipPipPipPip
  • 6685 сообщений
224
  • EVE Ingame:Trimutius III
  • EVE Alt:Weldy StarFiner
  • Corp:F-053
  • Channel:ru-help
  • Client:Eng

Насколько я знаю Май спейс на MSsql, а нагрузки и трафик там на несколько порядков выше

Ну трафик может быть, ведь у ЕВЫ он всего лишь несколько десятков гигов в час... А все эти скачки фильмов и т п с май-спейса это приличный такой трафик... Но вот насчёт нагрузки на БД хз, ведь конечно трафик небольшой но сервер обращается к БД постоянно, в майспейсе там всё просто и глючить особо нечему, закачка и скачка вот и всё что там нужно, ну и создание новых профилей ещё может быть и удаление чего-нить. Ну в общем простые операции в то время как на сервере ЕВы всё куда как сложнее, в БД там нужно хранить сотни а то и тысячи а то и десятки тысяч кусков информации по каждому пилоты, ещё сотни тысяч кусков информации не связанных с отдельным пилотом (если не миллионы), и в каждый отдельный момент каждый пилот от десятков до сотен использует, трафик конечно не шибко большой потому что клиенту тупо передают информацию что нарисовать и от него получают информацию какие кнопки были нажаты, но вот что касается обработки всего этого объёма информации на сервере это невероятное что-то... Я вообще даже не могу себе представить как это работает (как работает майспейс представить нетрудно как я сказал там 4 базовых операции и никаких сложных взаимодействий, в отличии от ЕВы)
  • 0
Я посланник из ниоткуда в никуда. Никто и ничто не посылало меня. И хотя это невозможно, я всё-таки существую. ©Тримутиус
Изображение

#20
yleo

yleo

    Clone Grade Delta

  • Tech III Pilots
  • PipPip
  • 212 сообщений
8
  • EVE Ingame:yleo
  • Corp:R.eX.
  • Ally:DOG
  • Channel: R.EX. recruitment
  • Client:Eng
ццп дампы баз своих выкладывает в MsSQL вроде.

http://www.eveonline...a...0828&page=1
  • 0
rapture carebear




0 посетителей читают тему

0 members, 0 guests, 0 anonymous users