ГлавнаяФорумКонтактыEnglish version Консультация: +7 (863) 261-21-14, 241-63-29

TraffPRO

Демо версия

Документация

Как Купить

Поддержка

Поиск по сайту:   
Новое
Форум
Популярное
Новости

Выпущена новая версия Биллинга (Корпоративного интернет шлюза, софт роутера) TraffPro 1.4.8!
Все версии:
Доработана система блокировок:
Система автоматически следит за изменениями ip адресов у сайтов.
Система автоматически меняет данные на блокировки в течении всей работы системы, дополняя список блокируемых (разрешённых) ip для переданного администратором домена.
Блокирование по ip даёт гарантию недоступности как по http так и по https.
Блокировка осуществляется не только по http но и полностью ресурса, даже если он будет работать на нестандартном порту.

Добавлена функция блокировки подсетей, формат x.x.x.x/x (для примера 192.168.0.0/24, что в полной трансляции выглядит как сеть - 192.168.0.0 маска подсети - 255.255.255.0)

Блокировка по DNS запросам:
Позволяет блокировать ресурсы на уровне обращения к DNS серверу за предоставлением ip адреса.
Не требует вмешательство в работу DNS.

Добавлен скрипт сбора ip адресов для ручной блокировки по домену.

Файлы языковой поддержки поставляются в не зашифрованном виде, что позволяет менять названия и надписи в интерфейсе административной консоли и личного кабинета по усмотрению администратора.
 
Скачать новую версию для установки или обновления можно здесь



TraffPro 1.4.7Выпущена новая версия Биллинга (Корпоративного интернет шлюза, софт роутера) TraffPro 1.4.7!
Все версии:
  • Добавлена новая политика ядра шейпера, на каждый поток захвата пакетов введены раздельные потоки шейпера с раздльными очередями, несколько потоков шейпера на несколько потоков захвата в одной очереди, независимость потоков исходящего и входящего трафика.
  • Исправлена работа скрипта GOSREESTR загрузка списков блокируемых сайтов рос. реестра.
  • Добавлен отчёт для требований службы безопасности и органов МВД и ФСБ позволяющий:
  • Отобрать по параметрам посещения на домен, ip адрес, порт, по времени и дате.
  • Добавлен отчёт по ТОП (наиболее посещаемым) сайтам по всем пользователям, а так же по отдельному пользователю (пользователям).
  • Формирование блоков архивов посещений клиентов для продолжительного хранения соответствующего требованиям силовых структур, архивация.
  • Добавлен online чат для поддержки клиентов (Online Manager) находящийся на странице входа в клиентский кабинет.
  • Добавлен Online Manager для размещения на сторонних ресурсах, позволяет устанавливать Online Manager на корпоративные сайты, или сайты с информацией для клиентов.
  • Внесение изменений в систему антифлуда, помимо общисистемной конфигурации антифлуда появилась возможность указания независимых настроек антифлуда для отдельных клиентов. .
  • Возможность указывать количество разрешённых пакетов для всех протоколов для конкретного клиента.
  • Возможность указывать количество соединений по TCP и количество пакетов по UDP и прочим протоколам для конкретного клиента.
  • Доработан раздел системной конфигурации, добавлены подсказки наименований параметров в конфигурационном файле /etc/traffpro/traffpro.cfg для тех кто меняет параметры вручную.
  • Исправлена проблема некорректного отображения названий параметров раздела системной конфигурации для Ubuntu, Debian из за ошибки Mysql.
  • Доработано корректное отображение версии и подверсии в административной консоли.
  • Изменено местоположение некоторых пунктов меню, перенесены в меню более соответствующие смысловой нагрузке.
  • Исправлена ошибка установщика приводившая к удалению собственных форм договоров при обновлении.
  • Введено оповещение о выходе новых версий.
Провайдер версия:
  • Добавлена система моментальных платежей Робокасса robokassa.ru
Скачать новую версию можно здесь
Документация к новой версии здесь
Инструкция по быстрой установке, а так же дополнительная информация здесь
 
 
 
 



10.03.15

 
Новая документация по быстрой установке Корпоративного интернет шлюза (биллинга) TraffPro на OS Linux Fedora 20 - 21
 
Установка TraffPro + Fedora 20-21 быстрый старт (How To):
 
http://download.traffpro.ru/docs/1.4.6/howto.pdf
 



23.09.14

В версии 1.4.6-03 добавлена проверка каталогов /var/www или  /var/www/html для новых версий Ubuntu,Debian в которых был изменён каталог с документами html.



3.09.14

Выпущена новая версия TraffPro v 1.4.6

Все версии:
  • Добавлена функция автоподлючения для win информера.
  • Добавлен новый win информер с автоматическим стартом и подключением:
Устанавливать информер с применением групповых политик Active Directory.
Автоматически настраивать информер с помощью командной строки или копирования раздела реестра.
Автоматически авторизоваться клиентам сети не вводя логина и пароля (на основании авторизации ActiveDirectory).
Автоматически подключать интернет при входе на компьютере в свой профиль Windows.
Получать краткую информацию о потреблении трафика.
Автоматически отключаться от интернет при выходе из профиля Windows.
Не требует внесения данных о сетевых картах.
Не требует внесения данных о ip и MAC адресах клиентов.
Автоматически стартует при входе в профиль Windows.
При смене пользователя автоматически меняет данные и переподключает клиента.
Поддержка 32х и 64х битных платформ Windows.

  • Система переведена на более новые системы, теперь доступна установка на Fedora 19-20, Ubuntu 14.
  • Введён параметр отключения шейпера TraffPro, для возможности использования своих шейперов (параметр shaper_enable=false).
  • Введён новый параметр управления передачи в user space количества данных, позволяет уменьшить нагрузку на систему, производится копирование не всего пакета, а только первых 128 байт.(параметр paket_copy_enable=false)
  • Добавлена автоматическая загрузка списка блокируемых сайтов соглассно ФЗ РФ.
  • добавлен скрипт сбора доменов и ip адресов из базы посещений клиентов для блокировок посещений.
  • для OS Linux Fedora новых версий осуществлён совместимый переход на Maria DB
  • Внесены изменения в ядро системы для повышения производительности.
Внимание!!! Изменились системные требования, скачать новые системные требования можно по ссылке
Добавлена новая инструкция по настройке win информера
 



Статистика сайта
Статьи
Популярное
Функции
Голосование
Нужны базовые тарифы?

Да
Нет




Ответить
 Зависает Traffpro, Зависает Traffpro
ihor
21 октября 2015 10:51
Сообщение #1



  • 0

Репутация: - 0 +
Группа: Гости
Сообщений: 0
Регистрация: 1.01.1970
ICQ:--
Traffpro 1.4.6 FedoraRF 21 несколько раз за сутки зависает сервер с Traffpro, помогает только перезагрузка, в логах сообщения:


NMI watchdog: BUG: soft lockup - CPU#0 stuck for 22s! [billing:1935]
kernel: Modules linked in: xt_NFQUEUE xt_REDIRECT nf_nat_redirect xt_mark xt_nat xt_recent xt_conntrack nf_nat_
kernel: CPU: 0 PID: 1935 Comm: billing Not tainted 4.1.8-100.fc21.x86_64 #1


Отключил ACPI не помогло
Перейти в начало страницы
ihor
22 октября 2015 10:22
Сообщение #2



  • 0

Репутация: - 0 +
Группа: Гости
Сообщений: 0
Регистрация: 1.01.1970
ICQ:--
А при работающем сервере постоянно в журнале вот такое сообщение
traffpro-daemon-control[1867]: MAC ADDR EXIST 78687019700548

Вчера еще проскочило вот это
PTHREAD_CONTROL ERR NFQUEUE No buffer space available

Сервер продолжает зависать по нескольку раз в сутки.
Перейти в начало страницы
Sly
24 октября 2015 03:32
Сообщение #3


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
Увеличте количество потоков захвата и шейперов, установите меньший уровень таймаута шейперов. Информация поним в документе Руководство администратора, дополнительные параметры.

--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
ihor
26 октября 2015 18:08
Сообщение #4


Руководитель Проекта
  • 102

Репутация: - 0 +
Группа: Гости
Сообщений: 0
Регистрация: 1.01.1970
ICQ:--
Всю неделю этим занимаюсь. Пока стабильной работы добится не удалось, но зависает сейчас только при пиковых нагрузках.

параметр paket_copy_enable сильно влияет на загрузку системы?

В журнале много сообщений MAC ADDR EXIST 78687019700548 что они значат?
Перейти в начало страницы
Sly
27 октября 2015 19:26
Сообщение #5


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
Определитесь с причиной зависания,нехватка памяти, большая нагрузка, глюки просто? Поставьте логироваться состояние памяти, нагрузки, после зависания сервера посмотрите что влогах?

--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
ihor
28 октября 2015 20:54
Сообщение #6


Руководитель Проекта
  • 102

Репутация: - 0 +
Группа: Гости
Сообщений: 0
Регистрация: 1.01.1970
ICQ:--
запись
NMI watchdog: BUG: soft lockup - CPU#0 stuck for 22s! [billing:1935]

указывает на процессор.
Перейти в начало страницы
gavru
29 октября 2015 01:41
Сообщение #7


Руководитель Проекта
  • 102

Репутация: - 0 +
Группа: Гости
Сообщений: 0
Регистрация: 1.01.1970
ICQ:--
http://www.linux.org.ru/forum/linux-hardware/2970763

Посмотрите здесь.
Перейти в начало страницы
ihor
10 ноября 2015 10:34
Сообщение #8


Руководитель Проекта
  • 102

Репутация: - 0 +
Группа: Гости
Сообщений: 0
Регистрация: 1.01.1970
ICQ:--
Статья хорошая, но для ядра 2.6 В ядре 4.1.8 кроме acpi параметров других нет.
Настройками траффпро и системы добился стабильной работы примерно на 2 сутки. теперь перед зависанием в логе вот такие записи
kernel: net_ratelimit: 19 callbacks suppressed
kernel: nf_queue: full at 65535 entries, dropping packets(s)


эта ошибка появляется при настройках

shaper_thread_count=1
control_thread_count=3


Если меняю shaper_thread_count=3 или 2 зависает примерно раз в сутки
с ошибкой как в самом первом посте
NMI watchdog: BUG: soft lockup - CPU#0 stuck for 22s! [billing:1935]
kernel: Modules linked in: xt_NFQUEUE xt_REDIRECT nf_nat_redirect xt_mark xt_nat xt_recent xt_conntrack nf_nat_
kernel: CPU: 0 PID: 1935 Comm: billing Not tainted 4.1.8-100.fc21.x86_64 #1


Получается в первом случае не хватает памяти для очереди nf_queue:, а во втором процессор с нагрузкой не справляется. Но до зависания каждое из 4 ядер загружено ~ 25% ОЗУ 4 Гб.

Можно это исправить? Зависания происходят в разное время, как при нагрузках так и без просто через определенное время.


Перейти в начало страницы
Sly
10 ноября 2015 13:23
Сообщение #9


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
Поставьте такие параметры:
shaper_thread_count=16
control_thread_count=8
shaper_time_out=0

Если нагрузка на процессор не сильная будет то можно поставить параметр:
shaper_time_out=50
Если нагрузка не сильно увеличется то можно перевести до:
shaper_time_out=25

Так же можно поставить разделение потоков для примера:
control_all_or_inout=true
local_networks=192.168.0.0/16

Но при этом должны быть задействованы обязательно параметры редиректа, для примера:
redirect_server_auth_on=true
ip_to_redirect_auth="192.168.0.1"
port_to_redirect_auth=80
port_to_redirect_access_denied=80
port_to_redirect_no_money=80

И параметры:
ss_enabled=true
nat_data_in_db=true
log_route=true
Естественно с настройкой в админке внешних интерфейсов и шлюзов.


Примеры взяты с рабочего сервера, вам потребуется сменить данные о подсетях и ip адресах на свои.

Так же увеличьте таблицу NAT и хешей NAT, вторая часть ошибок может именно из за этого вываливаться.

ACPI - актуален для всех ядер, машина просто засыпает и отключает драйвера, соответственно traffpro перестаёт получать доступ к сетевым драйверам и виснет, так что его если отключили то хорошо.

Сообщение отредактировал Sly - 10 ноября 2015 23:34
--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
ihor
10 ноября 2015 16:01
Сообщение #10


Руководитель Проекта
  • 102

Репутация: - 0 +
Группа: Гости
Сообщений: 0
Регистрация: 1.01.1970
ICQ:--
Спасибо, изменил, наблюдаю.
Вы писали
Так же увеличьте таблицу NAT и хешей NAT,

Как это сделать?
Перейти в начало страницы
Sly
10 ноября 2015 17:48
Сообщение #11


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
MTU трогать не нужно, остальное более менее актуально:

Большие потоки трафика и Linux: прерывания, маршрутизатор и NAT-сервер из песочницы
Системное администрирование*
Написано по следам публикации Большие потоки трафика и управление прерываниями в Linux

В нашей городской сети более 30 тысяч абонентов. Суммарный объем внешних каналов — более 3 гигабит. А советы, данные в упомянутой статье, мы проходили еще несколько лет назад. Таким образом, я хочу шире раскрыть тему и поделиться с читателями своими наработками в рамках затрагиваемого вопроса.

В заметке описываются нюансы настройки/тюнинга маршрутизатора и NAT-сервера под управлением Linux, а также приведены некоторые уточнения по поводу распределения прерываний.



Прерывания


Раскидывание прерываний сетевых карт по разным ядрам — это самое первое, с чем сталкивается сисадмин при возрастании нагрузки на linux-маршрутизатор. В упомянутой статье тема освещена достаточно подробно — поэтому надолго останавливаться на этом вопросе мы не будем.

Хочу только отметить:

если вы вручную раскидываете прерывания, то вам необходимо остановить сервис irqbalance. Этот сервис предназначен как раз для автоматического регулирования прерываний между ядрами процессоров. Если вы делаете эту работу вручную — сервис лучше остановить;
не забудьте внести соответствующие правки в «автозагрузку» (например, /etc/rc.local) — т.к. после рестарта сервера все прерывания опять распределятся вкучку на одном ядре;
после рестарта сервера, сетевые карты могут получить (а скорее всего, именно так и будет) новые номера прерываний. Поэтому в /etc/rc.local лучше не вписывать руками конкретные номера прерываний — а автоматизировать с помощью вспомогательного скрипта распознавание, какая сетевая какое прерывание заняла.



Маршрутизатор


В первоначальной статье есть фраза «если сервер работает только маршрутизатором, то тюнинг TCP стека особого значения не имеет». Это утверждение в корне неверно. Конечно, на небольших потоках тюнинг не играет большой роли. Однако, если у вас большая сеть и соответствующая нагрузка — то тюнингом сетевого стека вам придется заняться.

Прежде всего, если по вашей сети «гуляют» гигабиты, то имеет смысл обратить свое внимание на MTU на ваших серверах и коммутаторах. В двух словах, MTU — это объем пакета, который можно передать по сети, не прибегая к его фрагментации. Т.е. сколько информации ваш один маршрутизатор может передать другому без фрагментирования. При значительном увеличении объемов передаваемых по сети данных, гораздо эффективнее передавать пакеты большего объема реже, — чем часто-часто пересылать мелкие пакеты данных.

Увеличиваем MTU на linux


/sbin/ifconfig eth0 mtu 9000

Увеличиваем MTU на коммутаторах


На коммутационном оборудовании обычно это будет называться jumbo-frame. В частности, для Cisco Catalyst 3750

3750(config)# system mtu jumbo 9000
3750(config)# exit
3750# reload

Заметьте: коммутатор затем надо перезагрузить. Кстати, mtu jumbo касаются только гигабитных линков, — 100-мбит такая команда не затрагивает.

Увеличиваем очередь передачи на linux


/sbin/ifconfig eth0 txqueuelen 10000

По умолчанию значение стоит 1000. Для гигабитных линков рекомендуется ставить 10000. В двух словах, это размер буфера передачи. Когда буфер наполняется до этого граничного значения, данные передаются в сеть.

Имейте ввиду, что если вы меняете размер MTU на интерфейсе какой-то железки — вы должны сделать то же самое и на интерфейсе её «соседа». Т.е., если вы увеличили MTU до 9000 на интерфейсе linux-роутера, то вы должны включить jumbo-frame на порту коммутатора, в который данный роутер включен. В противном случае сеть работать будет, но очень плохо: пакеты ходить по сети будут «через одного».

Итоги


В результате всех этих изменений, в сети возрастут «пинги» — но общая пропускная способность заметно возрастет, а нагрузка на активное оборудование снизится.

Сервер NAT


Операция NAT (Network Address Translation) является одной из самых дорогостоящих (в смысле, ресурсоёмких). Поэтому, если у вас большая сеть, без тюнинга NAT-сервера вам не обойтись.

Увеличение кол-ва отслеживаемых соединений


Для осуществления своей задачи, NAT-серверу необходимо «помнить» обо всех соединениях, которые через него проходят. Будь то «пинг» или чья-то «аська» — все эти сессии NAT-сервер «помнит» и отслеживает у себя в памяти в специальной таблице. Когда сессия закрывается, информация о ней из таблицы удаляется. Размер этой таблицы фиксирован. Именно поэтому если трафика через сервер идет достаточно много, а размера таблицы нехватает, — то NAT-сервер начинает «дропать» пакеты, рвать сессии, интернет начинает работать с жуткими перебоями, а на сам NAT-сервер бывает даже попасть по SSH становится просто невозможно.

Чтобы таких ужасов не происходило, необходимо адекватно увеличивать размер таблицы — в соответствии с проходящим через NAT трафиком:

/sbin/sysctl -w net.netfilter.nf_conntrack_max=524288

Настоятельно НЕ рекомендуется ставить такое большое значение, если у вас на NAT-сервере меньше 1 гигабайта оперативной памяти.

Посмотреть текущее значение можно вот так:

/sbin/sysctl net.netfilter.nf_conntrack_max

Посмотреть, насколько уже заполнена таблица отслеживания соединений, можно вот так:

/sbin/sysctl net.netfilter.nf_conntrack_count

Увеличение размера hash-таблицы


Пропорционально должная быть увеличена и хэш-таблица, в которой хранятся списки conntrack-записей.

echo 65536 > /sys/module/nf_conntrack/parameters/hashsize

Правило простое: hashsize = nf_conntrack_max / 8

Уменьшение значений time-out


Как вы помниите, NAT-сервер отслеживает только «живые» сессии, которые через него проходят. Когда сессия закрывается — информация о ней удаляется, дабы таблица не переполнялась. Информация о сессиях удаляется так же по тайм-ауту. Т.е., если втечение долгого времени в рамках соединения обмена траифка нет — оно закрывается и информация о нем так же удаляется из памяти NAT-а.

Однако, по умолчанию значения тайм-аутов стоят достаточно большие. Поэтому, при больших потоках трафика даже если вы растянете nf_conntrack_max до предела — вы все равно рискуете быстро столкнуться с переполнением таблицы и разрывами соединений.

Чтобы такого не произошло, необходимо грамотно выставить тайм-ауты отслеживания соединений на NAT-сервере.

Текущие значения можно посмотреть, например, так:

sysctl -a | grep conntrack | grep timeout

В результате вы увидите что-то подобное:

net.netfilter.nf_conntrack_generic_timeout = 600
net.netfilter.nf_conntrack_tcp_timeout_syn_sent = 120
net.netfilter.nf_conntrack_tcp_timeout_syn_recv = 60
net.netfilter.nf_conntrack_tcp_timeout_established = 432000
net.netfilter.nf_conntrack_tcp_timeout_fin_wait = 120
net.netfilter.nf_conntrack_tcp_timeout_close_wait = 60
net.netfilter.nf_conntrack_tcp_timeout_last_ack = 30
net.netfilter.nf_conntrack_tcp_timeout_time_wait = 120
net.netfilter.nf_conntrack_tcp_timeout_close = 10
net.netfilter.nf_conntrack_tcp_timeout_max_retrans = 300
net.netfilter.nf_conntrack_tcp_timeout_unacknowledged = 300
net.netfilter.nf_conntrack_udp_timeout = 30
net.netfilter.nf_conntrack_udp_timeout_stream = 180
net.netfilter.nf_conntrack_icmp_timeout = 30
net.netfilter.nf_conntrack_events_retry_timeout = 15

Это значения тайм-аутов в секундах. Как вы видите, значение net.netfilter.nf_conntrack_generic_timeout равно 600 (10 минут). Т.е. NAT-сервер будет держать в памяти информацию о сессии до тех пор, пока по ней будет «пробегать» хоть что-то хотя бы раз в 10 минут.

На первый взгляд, ничего страшного — но на самом деле это очень и очень много.

Если вы посмотрите на net.netfilter.nf_conntrack_tcp_timeout_established — то вы увидите там значение 432000. Другими словами, простую TCP-сессию ваш NAT-сервер будет отслеживать до тех пор, пока по ней не пробегает какой-нибудь пакетик хотя бы раз в 5 дней(!).

Говоря еще более простым языком, за-DDOS'ить такой NAT-сервер становится проще простого: его NAT-таблица (параметр nf_conntrack_max) переполняется «на ура» простейшим флудом — вследствие чего он будет рвать соединения и в худшем варианте быстро превратится в черную дыру.

Значения тайм-аутов рекомендуется ставить в пределах 30-120 секунд. Этого вполне достаточно для нормальной работы абонентов, и этого вполне хватит для своевременной очистки NAT-таблицы, исключающей её переполнение.

И не забудьте вписать соответствующие изменения в /etc/rc.local и /etc/sysctl.conf

Итоги


После тюнинга вы получите вполне жизнеспособный и производительный NAT-сервер. Конечно же, это только «базовый» тюнинг — мы не касались, например, тюнинга ядра и т.п. вещей. Однако, в большинстве случаев даже таких простых действий будет достаточно для нормальной работы достаточно большой сети. Как я уже говорил, в нашей сети более 30 тыс. абонентов, трафик которых обрабатывают 4 NAT-сервера.

В следующих выпусках:

большие потоки и высокопроизводительный шейпер;
большие потоки и высокопроизводительный файрвол.


Взято из этого блога:
http://habrahabr.ru/post/108763/

--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
Demit
24 августа 2016 04:28
Сообщение #12


Новичок
  • 17

Репутация: - 0 +
Группа: Посетители
Сообщений: 43
Регистрация: 31.03.2014
ICQ:--
все сделал по вашей теме, все равно зависает сервер, сервер пингуется, по ssh отвечает, но дело встает на проверке пароля, выскакивают ошибки

kernel:[94212.893234] NMI watchdog: BUG: soft lockup - CPU#13 stuck for 22s! [billing:7686]

kernel:[94224.915482] NMI watchdog: BUG: soft lockup - CPU#14 stuck for 22s! [fprintd:358496]

плиз помощь!

Сообщение отредактировал Demit - 24 августа 2016 04:42
Перейти в начало страницы
Sly
24 августа 2016 04:38
Сообщение #13


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
Какая версия TraffPro
В какое время суток зависание
Как именно зависает

acpi=off

Может он у вас тупо засыпает?
FAQ

Давно уже слышно не было, что бы зависал TraffPro.

Сообщение отредактировал Sly - 24 августа 2016 04:43
--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
Demit
24 августа 2016 04:45
Сообщение #14


Новичок
  • 17

Репутация: - 0 +
Группа: Посетители
Сообщений: 43
Регистрация: 31.03.2014
ICQ:--
сервер пингуется, по ssh отвечает, но дело встает на проверке пароля, выскакивают ошибки

kernel:[94212.893234] NMI watchdog: BUG: soft lockup - CPU#13 stuck for 22s! [billing:7686]

kernel:[94224.915482] NMI watchdog: BUG: soft lockup - CPU#14 stuck for 22s! [fprintd:358496]

сервер не спит, завис биллинг вот как полчаса назад, в самый пик,
Перейти в начало страницы
Demit
24 августа 2016 04:49
Сообщение #15


Новичок
  • 17

Репутация: - 0 +
Группа: Посетители
Сообщений: 43
Регистрация: 31.03.2014
ICQ:--
CPU: 13 PID: 7686 Comm: billing Tainted: G W L 3.19.8-100.fc20.x86_64 #1
Hardware name: Intel Corporation S5500HCV/S5500HCV, BIOS S5500.86B.01.00.0063.092120121436 09/21/2012
task: ffff88024c48cd80 ti: ffff880269e18000 task.ti: ffff880269e18000
RIP: 0010:[<ffffffff811167e2>] [<ffffffff811167e2>] smp_call_function_many%2B0x222/0x290
RSP: 0018:ffff880269e1bc98 EFLAGS: 00000202
RAX: 0000000000000004 RBX: 0000000000000018 RCX: ffff88016bc58940
RDX: 0000000000000004 RSI: 0000000000000018 RDI: 0000000000000000
RBP: ffff880269e1bcd8 R08: ffff88026a8b5000 R09: ffff88026fcd73e0
R10: ffffea00021d42c0 R11: ffffffff81387739 R12: 0000000000000292
R13: ffff880269e1bc48 R14: 0000000000000080 R15: 00dffff800080008
FS: 00007fd11e74c700(0000) GS:ffff88026fcc0000(0000) knlGS:0000000000000000
CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
CR2: 00007f71862e3000 CR3: 0000000087fc4000 CR4: 00000000000007e0
Stack:
000000000000000d 00000001811c6725 00000001ffffffff ffff880263cac000
00007fd0c0037000 00007fd0c0038000 ffff880263cac348 0000000000000001
ffff880269e1bd28 ffffffff8106a0f8 ffff880263cac000 00007fd0c0037000
Call Trace:
[<ffffffff8106a0f8>] native_flush_tlb_others%2B0xb8/0xc0
[<ffffffff8106a225>] flush_tlb_mm_range%2B0x65/0x180
[<ffffffff811c4dae>] tlb_flush_mmu_tlbonly%2B0x7e/0xe0
[<ffffffff811c56a4>] tlb_finish_mmu%2B0x14/0x50
[<ffffffff811c77a2>] zap_page_range%2B0xd2/0x120
[<ffffffff811db4c4>] SyS_madvise%2B0x294/0x860
[<ffffffff810c1734>] %3F finish_task_switch%2B0x64/0x150
[<ffffffff81022d7c>] %3F do_audit_syscall_entry%2B0x6c/0x70
[<ffffffff810242c3>] %3F syscall_trace_enter_phase1%2B0x143/0x1a0
[<ffffffff81763549>] system_call_fastpath%2B0x12/0x17
Code: 48 63 35 56 69 c0 00 89 c2 39 f0 0f 8d 6f fe ff ff 48 98 49 8b 0f 48 03 0c c5 00 8a d1 81 f6 41 18 01 74 cd 0f 1f 44 00 00 f3 90 <f6> 41 18 01 75 f8 48 63 35 25 69 c0 00 eb b7 0f b6 4d cc 4c 89
[92727.750472] NMI watchdog: BUG: soft lockup - CPU#13 stuck for 22s! [billing:7686]
[92727.752140] Modules linked in: xt_NFQUEUE xt_REDIRECT nf_nat_redirect xt_mark xt_nat nf_log_ipv4 nf_log_common xt_LOG xt_recent xt_connlimit xt_conntrack iptable_mangle iptable_nat nf_conntrack_ipv4 nf_$

помогите пожалуйста!

Сообщение отредактировал Demit - 24 августа 2016 04:51
Перейти в начало страницы
Demit
24 августа 2016 04:54
Сообщение #16


Новичок
  • 17

Репутация: - 0 +
Группа: Посетители
Сообщений: 43
Регистрация: 31.03.2014
ICQ:--
chkconfig --list

interrupts 0:выкл 1:выкл 2:вкл 3:вкл 4:вкл 5:вкл 6:выкл
netconsole 0:выкл 1:выкл 2:выкл 3:выкл 4:выкл 5:выкл 6:выкл
network 0:выкл 1:выкл 2:вкл 3:вкл 4:вкл 5:вкл 6:выкл
pdnsd 0:выкл 1:выкл 2:выкл 3:выкл 4:выкл 5:выкл 6:выкл
powerman 0:выкл 1:выкл 2:выкл 3:выкл 4:выкл 5:выкл 6:выкл

Version: traffpro.provider.1.4.7-08

Сообщение отредактировал Demit - 24 августа 2016 04:55
Перейти в начало страницы
Sly
24 августа 2016 06:24
Сообщение #17


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
Ещё раз спрошу:
Какая OS?

acpid отключили как в FAQ сказано?
Что в логах самой OS?

Сообщение отредактировал Sly - 24 августа 2016 06:27
--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
Demit
24 августа 2016 07:02
Сообщение #18


Новичок
  • 17

Репутация: - 0 +
Группа: Посетители
Сообщений: 43
Регистрация: 31.03.2014
ICQ:--
[quote%3DSly]Что в логах самой OS%3F


повторяем по порядку

Какая OS%3F
1.

Linux version 3.19.8-100.fc20.x86_64
Version: traffpro.provider.1.4.7-08

acpid отключили как в FAQ сказано%3F
2.
его нет

chkconfig --list
interrupts 0:выкл 1:выкл 2:вкл 3:вкл 4:вкл 5:вкл 6:выкл
netconsole 0:выкл 1:выкл 2:выкл 3:выкл 4:выкл 5:выкл 6:выкл
network 0:выкл 1:выкл 2:вкл 3:вкл 4:вкл 5:вкл 6:выкл
pdnsd 0:выкл 1:выкл 2:выкл 3:выкл 4:выкл 5:выкл 6:выкл
powerman 0:выкл 1:выкл 2:выкл 3:выкл 4:выкл 5:выкл 6:выкл

Что в логах самой OS%3F
3.
[b]Кратко
[/b]
CPU: 13 PID: 7686 Comm: billing Tainted: G W L 3.19.8-100.fc20.x86_64 #1
Hardware name: Intel Corporation S5500HCV/S5500HCV, BIOS S5500.86B.01.00.0063.092120121436 09/21/2012
task: ffff88024c48cd80 ti: ffff880269e18000 task.ti: ffff880269e18000
RIP: 0010:[<ffffffff811167e2>] [<ffffffff811167e2>] smp_call_function_many%2B0x222/0x290
RSP: 0018:ffff880269e1bc98 EFLAGS: 00000202
RAX: 0000000000000004 RBX: 0000000000000018 RCX: ffff88016bc58940
RDX: 0000000000000004 RSI: 0000000000000018 RDI: 0000000000000000
RBP: ffff880269e1bcd8 R08: ffff88026a8b5000 R09: ffff88026fcd73e0
R10: ffffea00021d42c0 R11: ffffffff81387739 R12: 0000000000000292
R13: ffff880269e1bc48 R14: 0000000000000080 R15: 00dffff800080008
FS: 00007fd11e74c700(0000) GS:ffff88026fcc0000(0000) knlGS:0000000000000000
CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
CR2: 00007f71862e3000 CR3: 0000000087fc4000 CR4: 00000000000007e0
Stack:
000000000000000d 00000001811c6725 00000001ffffffff ffff880263cac000
00007fd0c0037000 00007fd0c0038000 ffff880263cac348 0000000000000001
ffff880269e1bd28 ffffffff8106a0f8 ffff880263cac000 00007fd0c0037000
Call Trace:
[<ffffffff8106a0f8>] native_flush_tlb_others%2B0xb8/0xc0
[<ffffffff8106a225>] flush_tlb_mm_range%2B0x65/0x180
[<ffffffff811c4dae>] tlb_flush_mmu_tlbonly%2B0x7e/0xe0
[<ffffffff811c56a4>] tlb_finish_mmu%2B0x14/0x50
[<ffffffff811c77a2>] zap_page_range%2B0xd2/0x120
[<ffffffff811db4c4>] SyS_madvise%2B0x294/0x860
[<ffffffff810c1734>] %3F finish_task_switch%2B0x64/0x150
[<ffffffff81022d7c>] %3F do_audit_syscall_entry%2B0x6c/0x70
[<ffffffff810242c3>] %3F syscall_trace_enter_phase1%2B0x143/0x1a0
[<ffffffff81763549>] system_call_fastpath%2B0x12/0x17
Code: 48 63 35 56 69 c0 00 89 c2 39 f0 0f 8d 6f fe ff ff 48 98 49 8b 0f 48 03 0c c5 00 8a d1 81 f6 41 18 01 74 cd 0f 1f 44 00 00 f3 90 <f6> 41 18 01 75 f8 48 63 35 25 69 c0 00 eb b7 0f b6 4d cc 4c 89
[92727.750472] NMI watchdog: BUG: soft lockup - CPU#13 stuck for 22s! [billing:7686]
[92727.752140] Modules linked in: xt_NFQUEUE xt_REDIRECT nf_nat_redirect xt_mark xt_nat nf_log_ipv4 nf_log_common xt_LOG xt_recent xt_connlimit xt_conntrack iptable_mangle iptable_nat nf_conntrack_ipv4 nf_$


сервер пингуется, по ssh отвечает, но дело встает на проверке пароля, выскакивают ошибки

kernel:[94212.893234] NMI watchdog: BUG: soft lockup - CPU#13 stuck for 22s! [billing:7686]

kernel:[94224.915482] NMI watchdog: BUG: soft lockup - CPU#14 stuck for 22s! [fprintd:358496]

сервер не спит, завис биллинг вот как полчаса назад, в самый пик

Сообщение отредактировал Demit - 24 августа 2016 07:04
Перейти в начало страницы
Sly
24 августа 2016 07:32
Сообщение #19


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
У Fedora с версии 15 поменялась система инициализации. chkconfig ни чего толком не покажет.

ACPID лучше вообще через ядро отключить, в параметрах запуска ядра. что бы уже наверняка.

в логе
/var/log/messages есть сообщения от billing?

Просто судя по вашему логу тот который вы представили изначально всё упирается именно в icpid.

Сообщение отредактировал Sly - 24 августа 2016 07:36
--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
Sly
24 августа 2016 07:42
Сообщение #20


Руководитель Проекта
  • 102

Репутация: - 60 +
Группа: Администраторы
Сообщений: 4438
Регистрация: 15.02.2008
ICQ:--
Ещё поставьте логирование в файл состояние памяти и процессора каждые 1-2 секунды, и после зависания посмотреть как они себя ведут.
Желательно ещё длину очереди nf_queue поставить в лог.

--------------------
Учёт трафика бывает очень интересен, некоторые со мной не согласны, а зря :)
Перейти в начало страницы
 
« · Вопросы · »
Быстрый ответ Ответить
2чел. читают эту тему (гостей: 2)
Пользователей: 0

  Сейчас: 22 октября 2017 19:30