madanalysis/layout/cutflow.py

################################################################################
#  
#  Copyright (C) 2012-2023 Jack Araz, Eric Conte & Benjamin Fuks
#  The MadAnalysis development team, email: <ma5team@iphc.cnrs.fr>
#  
#  This file is part of MadAnalysis 5.
#  Official website: <https://github.com/MadAnalysis/madanalysis5>
#  
#  MadAnalysis 5 is free software: you can redistribute it and/or modify
#  it under the terms of the GNU General Public License as published by
#  the Free Software Foundation, either version 3 of the License, or
#  (at your option) any later version.
#  
#  MadAnalysis 5 is distributed in the hope that it will be useful,
#  but WITHOUT ANY WARRANTY; without even the implied warranty of
#  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
#  GNU General Public License for more details.
#  
#  You should have received a copy of the GNU General Public License
#  along with MadAnalysis 5. If not, see <http://www.gnu.org/licenses/>
#  
################################################################################


from __future__ import absolute_import
from madanalysis.layout.cutflow_for_dataset   import CutFlowForDataset
from madanalysis.layout.measure               import Measure
from madanalysis.layout.fom_calculation       import FomCalculation
from math                                     import sqrt
from six.moves import range

class CutFlow:

    def __init__(self,main):
        self.main         = main
        self.detail       = []
        self.isSignal     = False
        self.isBackground = False
        for i in range(0,len(main.datasets)):
            self.detail.append(CutFlowForDataset(main,main.datasets[i]))
            if main.datasets[i].background:
                self.isBackground=True
            else:
                self.isSignal=True
        self.background = CutFlowForDataset(main,0)
        self.signal     = CutFlowForDataset(main,0)
        self.fom        = FomCalculation(self.main)


    def Initialize(self):

        # Initialize cut list for each dataset
        for item in self.detail:
            item.Initialize()
            item.Calculate()

        # Initialize B/S
        self.CalculateSummary(self.signal,background=False)
        self.CalculateSummary(self.background,background=True)


    def calculateBSratio(self,B,eB,S,eS):
        return self.fom.Compute(S,eS,B,eB)


    def CalculateSummary(self,summary,background=True):

        # Ntotal
        summary.Ntotal=Measure()
        for i in range(0,len(self.detail)):
            if background!=self.main.datasets[i].background:
                continue
            summary.Ntotal.mean  += self.detail[i].Ntotal.mean
            summary.Ntotal.error += self.detail[i].Ntotal.error**2
        summary.Ntotal.error = sqrt(summary.Ntotal.error)

        # Prepare vectors
        myregs = self.main.regions.GetNames()
        if myregs == []:
            myregs = ['myregion']
        for reg in range(len(myregs)):
            if len(self.detail) > 0:
                for i in range(0, len(self.detail[0].Nselected[reg])):
                    summary.Nselected[reg].append(Measure())
                    summary.Nrejected[reg].append(Measure())
                    summary.eff[reg].append(Measure())
                    summary.effcumu[reg].append(Measure())

        # Fill selected and rejected
        for iset in range (0,len(self.detail)):
            if background!=self.main.datasets[iset].background:
                continue
            for reg in range(len(myregs)):
                for icut in range (0,len(self.detail[iset].Nselected[reg])):
                    summary.Nselected[reg][icut].mean  += self.detail[iset].Nselected[reg][icut].mean
                    summary.Nrejected[reg][icut].mean  += self.detail[iset].Nrejected[reg][icut].mean
                    summary.Nselected[reg][icut].error += self.detail[iset].Nselected[reg][icut].error**2
                    summary.Nrejected[reg][icut].error += self.detail[iset].Nrejected[reg][icut].error**2
        for reg in range(len(myregs)):
            if len(self.detail)>0:
                for icut in range(0, len(self.detail[0].Nselected[reg])):
                    summary.Nselected[reg][icut].error = sqrt(summary.Nselected[reg][icut].error)
                    summary.Nrejected[reg][icut].error = sqrt(summary.Nrejected[reg][icut].error)

        # Compute efficiencies
        for reg in range(len(myregs)):
            for i in range(0,len(summary.eff[reg])):
                if summary.Ntotal.mean!=0:
                    summary.effcumu[reg][i].mean=float(summary.Nselected[reg][i].mean)/float(summary.Ntotal.mean)
                    summary.effcumu[reg][i].error=Measure.binomialError(summary.Nselected[reg][i].mean,summary.Ntotal.mean)
                if i==0:
                    if summary.Ntotal.mean!=0:
                        summary.eff[reg][i].mean=float(summary.Nselected[reg][i].mean)/float(summary.Ntotal.mean)
                        summary.eff[reg][i].error=Measure.binomialError(summary.Nselected[reg][i].mean,summary.Ntotal.mean)
                else:
                    if summary.Nselected[reg][i-1].mean!=0:
                        summary.eff[reg][i].mean=float(summary.Nselected[reg][i].mean)/float(summary.Nselected[reg][i-1].mean)
                        summary.eff[reg][i].error=Measure.binomialError(summary.Nselected[reg][i].mean,summary.Nselected[reg][i-1].mean)