April 24, 2021 2 min read

Responsible AI Toolkit - Building Trustworthy ML Systems on Azure

Azure Responsible AI Machine Learning Ethics Fairness

Building machine learning systems that are fair, interpretable, and reliable is not just an ethical imperative - it’s becoming a regulatory requirement. Microsoft’s Responsible AI Toolkit provides tools to assess and improve the responsibility of your ML models. Today, I want to explore how to integrate these practices into your ML workflows.

The Responsible AI Principles

Microsoft’s Responsible AI framework encompasses six principles:

Fairness - AI should treat all people fairly
Reliability & Safety - AI should perform reliably and safely
Privacy & Security - AI should be secure and respect privacy
Inclusiveness - AI should empower everyone
Transparency - AI should be understandable
Accountability - People should be accountable for AI

The Responsible AI Dashboard

Setting Up in Azure ML

from azureml.core import Workspace, Experiment, Dataset
from azureml.responsibleai import RAIInsights

ws = Workspace.from_config()

# Load your trained model and test data
from azureml.core import Model
model = Model(ws, 'customer-churn-model')
test_dataset = Dataset.get_by_name(ws, 'customer_churn_test')
train_dataset = Dataset.get_by_name(ws, 'customer_churn_train')

# Create RAI Insights
rai_insights = RAIInsights(
    model=model,
    train=train_dataset.to_pandas_dataframe(),
    test=test_dataset.to_pandas_dataframe(),
    target_column='churn',
    task_type='classification',
    categorical_features=['gender', 'contract_type', 'payment_method']
)

# Add components
rai_insights.explainer.add()
rai_insights.error_analysis.add()
rai_insights.causal.add(treatment_features=['tenure', 'monthly_charges'])
rai_insights.counterfactual.add(total_CFs=10, desired_class='opposite')

# Compute insights
rai_insights.compute()

# Save to workspace
rai_insights.save(path='./rai_insights')

Model Interpretability with InterpretML

Global Explanations

from interpret.ext.blackbox import TabularExplainer
from interpret import show

# Create explainer
explainer = TabularExplainer(
    model,
    X_train,
    features=feature_names,
    classes=['No Churn', 'Churn']
)

# Global explanation
global_explanation = explainer.explain_global(X_test)

# Visualize
print("Feature Importance:")
for feature, importance in sorted(
    zip(global_explanation.get_feature_names(),
        global_explanation.get_feature_importance()),
    key=lambda x: abs(x[1]),
    reverse=True
)[:10]:
    print(f"  {feature}: {importance:.4f}")

# Interactive dashboard
from interpret_community.widget import ExplanationDashboard
ExplanationDashboard(global_explanation, model, dataset=X_test, true_y=y_test)

Local Explanations

# Explain individual predictions
local_explanation = explainer.explain_local(X_test.iloc[:5])

# Get explanations for each instance
for i in range(5):
    print(f"\nInstance {i}:")
    print(f"  Predicted: {model.predict(X_test.iloc[i:i+1])[0]}")
    print(f"  Actual: {y_test.iloc[i]}")

    local_importance = local_explanation.local_importance_values[0][i]
    for feature, importance in sorted(
        zip(feature_names, local_importance),
        key=lambda x: abs(x[1]),
        reverse=True
    )[:5]:
        print(f"  {feature}: {importance:+.4f}")

Fairness Assessment with Fairlearn

Assessing Fairness

from fairlearn.metrics import MetricFrame
from sklearn.metrics import accuracy_score, precision_score, recall_score

# Define sensitive features
sensitive_features = X_test['gender']

# Create metric frame
metric_frame = MetricFrame(
    metrics={
        'accuracy': accuracy_score,
        'precision': lambda y, p: precision_score(y, p, zero_division=0),
        'recall': lambda y, p: recall_score(y, p, zero_division=0),
        'selection_rate': lambda y, p: sum(p) / len(p)
    },
    y_true=y_test,
    y_pred=y_pred,
    sensitive_features=sensitive_features
)

# View results
print("Overall metrics:")
print(metric_frame.overall)
print("\nMetrics by group:")
print(metric_frame.by_group)

# Calculate disparity
print("\nDisparity (max - min):")
print(metric_frame.difference())

Visualizing Fairness

from fairlearn.widget import FairlearnDashboard

# Interactive dashboard
FairlearnDashboard(
    sensitive_features=sensitive_features,
    y_true=y_test,
    y_pred={"Original Model": y_pred}
)

Mitigating Bias

from fairlearn.reductions import ExponentiatedGradient, DemographicParity
from sklearn.linear_model import LogisticRegression

# Define constraint
constraint = DemographicParity()

# Create mitigated model
mitigator = ExponentiatedGradient(
    LogisticRegression(solver='liblinear'),
    constraints=constraint
)

# Fit with sensitive features
mitigator.fit(X_train, y_train, sensitive_features=X_train['gender'])

# Predict
y_pred_mitigated = mitigator.predict(X_test)

# Compare fairness
metric_frame_mitigated = MetricFrame(
    metrics={'accuracy': accuracy_score, 'selection_rate': lambda y, p: sum(p) / len(p)},
    y_true=y_test,
    y_pred=y_pred_mitigated,
    sensitive_features=X_test['gender']
)

print("Original Model Disparity:", metric_frame.difference()['selection_rate'])
print("Mitigated Model Disparity:", metric_frame_mitigated.difference()['selection_rate'])

Error Analysis

Using Error Analysis Tool

from erroranalysis import ModelAnalyzer, report

# Create analyzer
analyzer = ModelAnalyzer(
    model=model,
    dataset=X_test,
    true_y=y_test,
    feature_names=feature_names,
    categorical_features=categorical_features
)

# Generate error tree
error_tree = analyzer.compute_error_tree()

# Get high error cohorts
cohorts = analyzer.get_high_error_cohorts()

for cohort in cohorts:
    print(f"\nCohort: {cohort.description}")
    print(f"  Error rate: {cohort.error_rate:.2%}")
    print(f"  Size: {cohort.size}")
    print(f"  Filters: {cohort.filters}")

Custom Cohort Analysis

# Define cohorts based on business logic
from responsibleai import Cohort

cohorts = [
    Cohort("High Value Customers",
           filters=[("monthly_charges", ">", 70)]),
    Cohort("Long Tenure",
           filters=[("tenure", ">", 36)]),
    Cohort("New Customers - High Risk",
           filters=[("tenure", "<", 6), ("contract_type", "==", "Month-to-month")])
]

# Analyze each cohort
for cohort in cohorts:
    subset = cohort.filter(X_test, y_test, y_pred)
    accuracy = accuracy_score(subset['y_true'], subset['y_pred'])
    print(f"{cohort.name}: Accuracy = {accuracy:.2%}, Size = {len(subset)}")

Counterfactual Explanations

What-If Analysis

from dice_ml import Data, Model, Dice

# Prepare data for DiCE
data = Data(
    dataframe=df_train,
    continuous_features=['age', 'tenure', 'monthly_charges'],
    outcome_name='churn'
)

# Wrap model
model_wrapper = Model(model=model, backend='sklearn')

# Create explainer
explainer = Dice(data, model_wrapper)

# Generate counterfactuals
instance = X_test.iloc[0:1]
print(f"Original prediction: {model.predict(instance)[0]}")

counterfactuals = explainer.generate_counterfactuals(
    instance,
    total_CFs=5,
    desired_class='opposite'
)

# Display counterfactuals
counterfactuals.visualize_as_dataframe()

Interpreting Counterfactuals

# Get actionable insights
cf_df = counterfactuals.cf_examples_list[0].final_cfs_df

print("To change the prediction, consider these changes:")
original = instance.iloc[0]

for idx, cf in cf_df.iterrows():
    print(f"\nCounterfactual {idx + 1}:")
    for col in cf.index:
        if col != 'churn' and original[col] != cf[col]:
            print(f"  Change {col}: {original[col]} -> {cf[col]}")

Causal Analysis

from econml.dml import CausalForestDML
from sklearn.ensemble import GradientBoostingRegressor, GradientBoostingClassifier

# Define treatment and outcome
treatment = 'tenure_extension_offer'  # Binary treatment
outcome = 'churn'

# Estimate causal effect
causal_model = CausalForestDML(
    model_t=GradientBoostingClassifier(),
    model_y=GradientBoostingClassifier(),
    n_estimators=100,
    random_state=42
)

# Fit model
W = X_train.drop([treatment, outcome], axis=1)
causal_model.fit(
    Y=y_train,
    T=X_train[treatment],
    X=W
)

# Estimate treatment effect
treatment_effect = causal_model.effect(X_test.drop([treatment, outcome], axis=1))

print(f"Average Treatment Effect: {treatment_effect.mean():.4f}")
print(f"Effect Range: [{treatment_effect.min():.4f}, {treatment_effect.max():.4f}]")

# Who benefits most from intervention?
beneficiaries = X_test[treatment_effect > 0.1]
print(f"\nCustomers who would benefit most: {len(beneficiaries)}")

Implementing RAI in CI/CD

# responsible_ai_checks.py

def check_fairness_constraints(model, X_test, y_test, sensitive_features, threshold=0.1):
    """Check if model meets fairness constraints."""
    from fairlearn.metrics import MetricFrame, demographic_parity_difference

    y_pred = model.predict(X_test)

    dpd = demographic_parity_difference(
        y_test, y_pred, sensitive_features=sensitive_features
    )

    if abs(dpd) > threshold:
        raise ValueError(f"Demographic parity difference ({dpd:.4f}) exceeds threshold ({threshold})")

    return True


def check_model_explainability(model, X_test, min_features_explained=0.8):
    """Check if model has sufficient explainability."""
    from interpret.ext.blackbox import TabularExplainer

    explainer = TabularExplainer(model, X_test)
    explanation = explainer.explain_global(X_test)

    top_features = explanation.get_feature_importance()
    cumulative_importance = sum(sorted(top_features, reverse=True)[:int(len(top_features) * 0.3)])

    if cumulative_importance < min_features_explained:
        raise ValueError(f"Model explainability insufficient: top 30% features explain only {cumulative_importance:.2%}")

    return True


def run_responsible_ai_checks(model, X_test, y_test, sensitive_features):
    """Run all RAI checks."""
    checks = [
        ("Fairness", lambda: check_fairness_constraints(model, X_test, y_test, sensitive_features)),
        ("Explainability", lambda: check_model_explainability(model, X_test)),
    ]

    results = []
    for name, check in checks:
        try:
            check()
            results.append((name, "PASSED"))
        except Exception as e:
            results.append((name, f"FAILED: {str(e)}"))

    return results

Best Practices

Assess early and often - Integrate RAI checks throughout development
Document decisions - Record fairness metrics and mitigation choices
Involve stakeholders - Include diverse perspectives in assessment
Monitor in production - Track fairness metrics post-deployment
Plan for updates - Models may drift, requiring re-assessment
Be transparent - Share model limitations with users
Use multiple metrics - Single metrics can be misleading
Test edge cases - Focus on underrepresented groups

Conclusion

Responsible AI is not a checkbox but an ongoing practice. The tools in Microsoft’s Responsible AI Toolkit help you assess fairness, interpret models, analyze errors, and understand causal relationships. By integrating these practices into your ML workflows, you can build systems that are not only accurate but also trustworthy and equitable.