Андрій
NoDeny
Старожил
Карма: 3
Offline
Сообщений: 294
|
|
« : 05 Октября 2011, 18:24:00 » |
|
Час від часу без якоїсь періодичності зависає сателіт, після обновлення всіх портів, перевірки памяті і т.д, поміняв серевер на зовсім інший - думав щось з залізом, але ситуація не змінилася. Після 5-и днів роботи сервер знову завис - не реагує клавіатура, в логах нічого нема, які можуть бути причини ? FreeBSD 8.2 - mpd5 ipcad ipfw pf apache dhcpd snmpd. На всякий випадок зараз ipcad відключив оскільки він навантажував систему на 25 %, але не думаю що то в ньому є причина, також в ядрі відключив options FLOWTABLE, трафік максимум 400 мбіт, але може зависати навіть при 100 мбітах. Що ще можна зробити для діагностики\вирішення проблеми ?
|
|
|
Записан
|
|
|
|
VitalVas
NoDeny
Спец
Карма: 60
Offline
Сообщений: 991
|
|
« Ответ #1 : 05 Октября 2011, 19:32:42 » |
|
показати що в тебе в ядрі, pps... все що може допомоти розібратись з проблемою
|
|
|
Записан
|
|
|
|
Андрій
NoDeny
Старожил
Карма: 3
Offline
Сообщений: 294
|
|
« Ответ #2 : 05 Октября 2011, 20:01:42 » |
|
показати що в тебе в ядрі, pps... все що може допомоти розібратись з проблемою
ядро стандартне, під час зависань навантаження на сервер може бути дуже маленьке. Залізо все поміняли крім мережевих карт - стоять інтел сервер адаптер 1000, 2 карточки по одному порту, може бути з ними проблема ?
|
|
|
Записан
|
|
|
|
Rico-X
NoDeny
Старожил
Карма: 7
Offline
Сообщений: 349
|
|
« Ответ #3 : 05 Октября 2011, 20:14:00 » |
|
Шепну по секрету, обнови фрю до STABLE этому багу уже больше года Все релизы FreeBSD вплоть до 8.2-RELEASE включительно содержат races в ядре, которые с некоторой небольшой вероятностью приводят к панике при удалении системного интерфейса, что при использовании mpd случается часто. Нахождение и исправление этих проблем - заслуга Глеба Смирнова, который закоммитил исправления в 9-CURRENT и 8.2-STABLE в марте-апреле этого года (перед этим я несколько недель гонял патчи под нагрузкой). Поэтому, если важна стабильность - нужно обновляться до 8.2-STABLE или ждать 8.3-RELEASE.
Проблема проявляется не у всех. Если у вас не слишком большая нагрузка (скажем, до 500 одновременных сессий), то роутер и без этих исправлений может работать многими неделями, не паникуя. А при количестве сессий около 1000 мои роутеры паниковали каждый через пару-тройку дней, то есть почти каждый день который-нибудь да падал. Но с упомянутыми фиксами уже много недель всё стабильно. (с) http://dadv.livejournal.com/138951.html
|
|
« Последнее редактирование: 05 Октября 2011, 20:18:18 от Rico-X »
|
Записан
|
|
|
|
Андрій
NoDeny
Старожил
Карма: 3
Offline
Сообщений: 294
|
|
« Ответ #4 : 06 Октября 2011, 10:43:23 » |
|
Шепну по секрету, обнови фрю до STABLE этому багу уже больше года Все релизы FreeBSD вплоть до 8.2-RELEASE включительно содержат races в ядре, которые с некоторой небольшой вероятностью приводят к панике при удалении системного интерфейса, что при использовании mpd случается часто. Нахождение и исправление этих проблем - заслуга Глеба Смирнова, который закоммитил исправления в 9-CURRENT и 8.2-STABLE в марте-апреле этого года (перед этим я несколько недель гонял патчи под нагрузкой). Поэтому, если важна стабильность - нужно обновляться до 8.2-STABLE или ждать 8.3-RELEASE.
Проблема проявляется не у всех. Если у вас не слишком большая нагрузка (скажем, до 500 одновременных сессий), то роутер и без этих исправлений может работать многими неделями, не паникуя. А при количестве сессий около 1000 мои роутеры паниковали каждый через пару-тройку дней, то есть почти каждый день который-нибудь да падал. Но с упомянутыми фиксами уже много недель всё стабильно. (с) http://dadv.livejournal.com/138951.htmlЯ так розумію якщо б в мене була ця проблема то в логах щось би писало, а в мене зависає і нічого не пише
|
|
|
Записан
|
|
|
|
Rico-X
NoDeny
Старожил
Карма: 7
Offline
Сообщений: 349
|
|
« Ответ #5 : 06 Октября 2011, 10:58:14 » |
|
В логах ничего не пишет, ядро уходит в панику и даже само не перегружает машину. Я с этой проблемой 4 раза сталкивался, причем сателит работает нормально от нескольких часов, до нескольких недель. В общем либо обновляй до STABLE либо ставь 7 ветку. В чем проблема обновиться то?
|
|
|
Записан
|
|
|
|
Андрій
NoDeny
Старожил
Карма: 3
Offline
Сообщений: 294
|
|
« Ответ #6 : 06 Октября 2011, 11:01:46 » |
|
В логах ничего не пишет, ядро уходит в панику и даже само не перегружает машину. Я с этой проблемой 4 раза сталкивался, причем сателит работает нормально от нескольких часов, до нескольких недель. В общем либо обновляй до STABLE либо ставь 7 ветку. В чем проблема обновиться то?
та справа в тому що сервер від мене знаходиться 200км, і якщо під час обновлення щось піде не так то прийдеться туди їхати) Яким чином мені обновитися до 8.2-STABLE ? зараз стоїть FreeBSD 8.2-RELEASE
|
|
|
Записан
|
|
|
|
Rico-X
NoDeny
Старожил
Карма: 7
Offline
Сообщений: 349
|
|
« Ответ #7 : 06 Октября 2011, 13:48:54 » |
|
*default release=cvs tag=RELENG_8 Если обновляешься в первый раз, то сначала прогони *default release=cvs tag=RELENG_8_2 list=RELENG_8 а после уже *default release=cvs tag=RELENG_8. Подробней про обновление фри http://habrahabr.ru/blogs/bsdelniki/113441/ или в гугле найдешь кучу статей. Да, раз все равно обновляться буш, наложи патчи http://i-notes.org/freebsd-hw-em-max_interrupt_rate-patch/Ну и чтоб совсем хорошо работал, следуй рекомендациям отсюда: http://dadv.livejournal.com/138951.htmlhttp://dadv.livejournal.com/139170.htmlhttp://dadv.livejournal.com/139366.htmlЕще вот с моего сателита cat /etc/sysctl.conf #security.bsd.see_other_uids=0 vfs.read_max=32 net.inet.ip.forwarding=1 #(N)включаем форвардинг пакетов net.inet.ip.fastforwarding=1 #(N)эта опция действительно ускоряет форвардинг net.inet.ip.dummynet.io_fast=1 #заставляет dummynet работать побыстрее #net.inet.ip.dummynet.max_chain_len=2048 #(N) net.inet.ip.dummynet.hash_size=65535 #(N)Было 256 net.inet.ip.dummynet.pipe_slot_limit=2048 # #sysctl kern.polling.enable=1 #IGB сетевые потдерживают аппаратный пуллинг, при необходимости включить отдельно на сетевухе #sysctl kern.polling.user_frac=50 net.inet.ip.fw.one_pass=1 #пакеты, прошедшие пайпы вылетают из фаервола, и дальше не идут по нему net.inet.tcp.blackhole=2 #ядро убивает tcp пакеты, приходящие в систему на непрослушиваемые порты net.inet.udp.blackhole=1 #ядро убивает udp пакеты, приходящие в систему на непрослушиваемые порты net.inet.icmp.drop_redirect=1 #не обращаем внимания на icmp redirect net.inet.icmp.log_redirect=0 #(N) и не логируем их net.inet.icmp.maskrepl=0 #не отдавать по icmp маску своей подсети net.inet.icmp.icmplim=100 net.inet.icmp.bmcastecho=0 #(N) защита от SMURF атак net.inet.ip.redirect=0 #(N) не реагируем на icmp redirect net.inet.ip.sourceroute=0 #(N) отключение маршрутизации от источника net.inet.ip.accept_sourceroute=0 #(N) старый и бесполезный механизм net.inet.ip.ttl=226 #(N)почему бы не поставить ttl побольше было 64 ;) net.inet.tcp.drop_synfin=1 #(N)небольшая защита net.inet.tcp.syncookies=1 #(N)от доса kern.ipc.somaxconn=32768 #(N)увеличиваем размер очереди для сокетов kern.maxfiles=204800 #(N)увеличиваем число открытых файловых дескрипторов kern.maxfilesperproc=200000 #(N)кол-во ф.д. на каждоый процесс kern.ipc.nmbclusters=524288 #(N)увеличиваем число сетевых буферов kern.ipc.maxsockbuf=83886080 #(N) kern.random.sys.harvest.ethernet=0 #(N)не использовать трафик и прерывания kern.random.sys.harvest.interrupt=0 #(N)как источник энтропии для random'a kern.ipc.shmmax=67108864 #(N)макс. размер сегмента памяти net.inet.ip.intr_queue_maxlen=10240 #(N)размер очереди ip-пакетов #MPD net.graph.maxdgram=128000 net.graph.recvspace=128000
dev.em.0.rx_int_delay=200 dev.em.0.tx_int_delay=200 #dev.em.2.rx_abs_int_delay=4000 #dev.em.2.tx_abs_int_delay=4000 #dev.em.2.rx_processing_limit=4096
dev.em.1.rx_int_delay=200 dev.em.1.tx_int_delay=200 #dev.em.1.rx_abs_int_delay=4000 #dev.em.1.tx_abs_int_delay=4000 #dev.em.1.rx_processing_limit=4096
#dev.igb.0.rx_processing_limit=4096 #dev.igb.1.rx_processing_limit=4096
# for rtsock net.route.netisr_maxqlen=4096 # for other protocols (IP & PPPoE?) #net.isr.defaultqlimit=4096
# default outgoing interface queue length # used by lagg etc. #net.link.ifqmaxlen=10240 Для начала пойдет
|
|
|
Записан
|
|
|
|
Андрій
NoDeny
Старожил
Карма: 3
Offline
Сообщений: 294
|
|
« Ответ #8 : 06 Октября 2011, 14:17:37 » |
|
спс, буду пробувати
|
|
|
Записан
|
|
|
|
Maks
NoDeny
Ветеран
Карма: 13
Offline
Сообщений: 575
Скажи спасибо - подними карму.
|
|
« Ответ #9 : 11 Октября 2011, 09:10:25 » |
|
В логах ничего не пишет, ядро уходит в панику и даже само не перегружает машину. Я с этой проблемой 4 раза сталкивался, причем сателит работает нормально от нескольких часов, до нескольких недель. В общем либо обновляй до STABLE либо ставь 7 ветку. В чем проблема обновиться то?
На 7.2 и 7.4 проблема таже ( на 8 все еще не обновился)
|
|
|
Записан
|
|
|
|
elite
Начальник планеты
NoDeny
Спец
Карма: 52
Offline
Сообщений: 1226
In LAN we trust!
|
|
« Ответ #10 : 11 Октября 2011, 14:21:15 » |
|
В логах ничего не пишет, ядро уходит в панику и даже само не перегружает машину. Я с этой проблемой 4 раза сталкивался, причем сателит работает нормально от нескольких часов, до нескольких недель. В общем либо обновляй до STABLE либо ставь 7 ветку. В чем проблема обновиться то?
ну так обновись ) На 7.2 и 7.4 проблема таже ( на 8 все еще не обновился)
|
|
|
Записан
|
|
|
|
Андрій
NoDeny
Старожил
Карма: 3
Offline
Сообщений: 294
|
|
« Ответ #11 : 31 Октября 2011, 15:47:22 » |
|
options FLOWTABLE # per-cpu routing cache була проблема з цією опцією ядра, після того як я її закоментував то проблема пропала, в STABLE цієї опції взагалі немає тому і зависань нема )
|
|
|
Записан
|
|
|
|
Demeo
NoDeny
Постоялец
Карма: 6
Offline
Сообщений: 204
|
|
« Ответ #12 : 01 Ноября 2011, 09:21:18 » |
|
При этой опции одно ядро часто на полку ложится - весь роутинг стопорится и зайти на машину можно только с внутреннего интерфейса либо локально
|
|
|
Записан
|
|
|
|
gonhik
Пользователь
Карма: 0
Offline
Сообщений: 76
|
|
« Ответ #13 : 06 Января 2012, 09:23:15 » |
|
|
|
|
Записан
|
|
|
|
Rico-X
NoDeny
Старожил
Карма: 7
Offline
Сообщений: 349
|
|
« Ответ #14 : 06 Января 2012, 10:32:46 » |
|
Эмм хрустальный шар говорит смотреть в сторону NAT и впилен ли PF в новое ядро, а так без логов - ХЗ
|
|
|
Записан
|
|
|
|
|