пока сделал такие изменения, заменили процы с 2хL5420 @ 2.50GHz на 2хL5420 @ 3.00GHz, все таки частота в нашем деле играет роль, как и смена архитектуры на поболее новее, также добавил в loader и sysctl
loader.conf
pf_load="YES"
ipfw_load="YES"
ipdivert_load="YES"
dummynet_load="YES"
if_lagg_load="YES"
autoboot_delay=3 # (default 10) seconds
loader_logo="beastie"
#kern osnovnie funkcii yadra
#vm podsistema virtualynoi pamyati
#vfs faylovaya sistema
#net setevie finkcii
#debug otladochnayz infa
#hw infa ob aparatnih sredstvah
#security parametri obespecheniya bezopasnosti
#dev informaciya drayverov ustroystv
machdep.hyperthreading_allowed="0" # Disabling Hyper-threading (default 1, allow Hyper Threading (HT))
#kern.hz="1000"
#net.inet.ip.fw.default_to_accept=1
net.inet.tcp.hostcache.bucketlimit=100 #30
net.inet.tcp.hostcache.cachelimit=0 #15360
net.inet.tcp.hostcache.hashsize=4096 #512
net.inet.tcp.syncache.cachelimit=65536 # 15375
net.inet.tcp.syncache.hashsize=1024 # (def=512) 4096 syncache hash size
net.inet.tcp.syncache.bucketlimit=100 # (def=30) syncache bucket limit
#net.inet.tcp.tcbhashsize=524288 # (def=65536) tcb hash size
net.isr.bindthreads=1 # 0 Bind netisr threads to CPUs
net.isr.defaultqlimit=4096 # (default 256)
#net.isr.maxthreads=7 # Use at most this many CPUs for netisr processing
net.isr.maxthreads=8
# limit per-workstream queues (use "netstat -Q" if Qdrop is greater then 0
# increase this directive) (default 10240)
#net.isr.maxqlimit=65536 # or 40960 or 16384
net.isr.numthreads=8
net.link.ifqmaxlen=10240 # or 16384 (default 50)
#hw.intr_storm_threshold=24000
#hw.em.rxd=4096
#hw.em.txd=4096
#hw.em.rx_process_limit=4096
#hw.em.rx_process_limit=-1
#hw.em.rx_abs_int_delay=1000 # or 2000 or 4000
#hw.em.tx_abs_int_delay=1000 # or 2000 or 4000
#hw.em.rx_int_delay=100 # or 200
#hw.em.tx_int_delay=100 # or 200
hw.igb.rxd=4096 # 1024
hw.igb.txd=4096 # 1024
#hw.igb.enable_msix=1
hw.igb.max_interrupt_rate=32000 # def-8000, 32000 or 64000
hw.igb.num_queues=8 #or7 def-0
hw.igb.rx_process_limit=4096 #or -1 def-100
#hw.ix.enable_aim=0
#hw.ix.max_interrupt_rate=62500 # (default 31250)
#hw.ix.num_queues=8
#hw.ix.tx_process_limit=-1 #or 512 def-256
#hw.ix.rx_process_limit=-1 #or 512 def-256
#hw.ix.rx_process_limit=4096
#hw.ix.tx_process_limit=4096
#hw.ix.rxd=4096
#hw.ix.txd=4096
#hw.ix.unsupported_sfp=1
#dev.em.0.rx_int_delay=200
#dev.em.0.tx_int_delay=200
#dev.em.0.rx_abs_int_delay=4000
#dev.em.0.tx_abs_int_delay=4000
#dev.em.1.rx_int_delay=200
#dev.em.1.tx_int_delay=200
#dev.em.1.rx_abs_int_delay=4000
#dev.em.1.tx_abs_int_delay=4000
#dev.ix.0.rx_processing_limit=4096
#dev.ix.1.rx_processing_limit=4096
#dev.ix.0.iflib.override_nrxqs=12
#dev.ix.0.iflib.override_ntxqs=12
#dev.ix.0.queue0.interrupt_rate: 500000
#dev.ix.0.link_irq: 9
#dev.ix.0.watchdog_events: 0
#dev.ix.0.mbuf_defrag_failed: 0
#dev.ix.0.dropped: 0
#dev.ix.0.thermal_test: 0
#dev.ix.0.advertise_speed: 0
#dev.ix.0.enable_aim: 1
#dev.ix.0.fc: 3
#dev.ix.0.tx_processing_limit: 512
#dev.ix.0.rx_processing_limit: 512
#net.pf.source_nodes_hashsize="1048576" # (default 32768)
sysctl
net.inet.ip.dummynet.expire=0 #1
net.inet.ip.dummynet.hash_size=2048 #64 up to 65535
net.inet.ip.dummynet.pipe_slot_limit=1000 #100 up to 2048 or 4096
net.inet.ip.dummynet.io_fast=1 #0 разгружает dummynet надо пробовать
sysctl вводил все одним за другим, и после net.inet.ip.dummynet.io_fast отпустило с загрузки ядра 75-85% до 45-55% при том же трафике, хотя многие и хаяли этот параметр, правда как будет далее время покажет